基于深度学习识别模型的缺陷检测

科技 2024-02-18 18:04 泰国

微信改了推送规则，如果您还想收到我们的推送！

点击上方“机器视觉”，右上角...选择“置顶/星标”公众号

一、介绍

缺陷检测被广泛使用于布匹瑕疵检测、工件表面质量检测、航空航天领域等。传统的算法对规则缺陷以及场景比较简单的场合，能够很好工作，但是对特征不明显的、形状多样、场景比较混乱的场合，则不再适用。近年来，基于深度学习的识别算法越来越成熟，许多公司开始尝试把深度学习算法应用到工业场合中。

二、缺陷数据

如下图所示，这里以布匹数据作为案例，常见的有以下三种缺陷，磨损、白点、多线。

如何制作训练数据呢？这里是在原图像上进行截取，截取到小图像，比如上述图像是512x512，这里我裁剪成64x64的小图像。这里以第一类缺陷为例，下面是制作数据的方法。

注意：在制作缺陷数据的时候，缺陷面积至少占截取图像的2/3，否则舍弃掉，不做为缺陷图像。

一般来说，缺陷数据都要比背景数据少很多，此外通过增强后的数据，缺陷：背景=1：1，每类在1000幅左右~~~

三、网络结构

具体使用的网络结构如下所示，输入大小就是64x64x3，采用的是截取的小图像的大小。每个Conv卷积层后都接BN层，具体层参数如下所示。

Conv1：64x3x3
Conv2：128x3x3
ResNetBlock和DenseNetBlock各两个，具体细节请参考残差网络和DenseNet。
Add：把残差模块输出的结果和DenseNetBlock输出的结果在对应feature map上进行相加，相加方式和残差模块相同。注意，其实这里是为了更好的提取特征，方式不一定就是残差模块+DenseNetBlock，也可以是inception，或者其它。
Conv3：128x3x3
Maxpool：stride=2，size=2x2
FC1：4096
Dropout1：0.5
FC2：1024
Dropout1：0.5
Softmax：对应的就是要分的类别，在这里我是二分类。

关于最后的损失函数，建议选择Focal Loss，这是何凯明大神的杰作，源码如下所示：

数据做好，就可以开始训练了~~~

四、整幅场景图像的缺陷检测

上述训练的网络，输入是64x64x3的，但是整幅场景图像却是512x512的，这个输入和模型的输入对不上号，这怎么办呢？其实，可以把训练好的模型参数提取出来，然后赋值到另外一个新的模型中，然后把新的模型的输入改成512x512就好，只是最后在conv3+maxpool层提取的feature map比较大，这个时候把feature map映射到原图，比如原模型在最后一个maxpool层后，输出的feature map尺寸是8x8x128，其中128是通道数。如果输入改成512x512，那输出的feature map就成了64x64x128，这里的每个8x8就对应原图上的64x64，这样就可以使用一个8x8的滑动窗口在64x64x128的feature map上进行滑动裁剪特征。然后把裁剪的特征进行fatten，送入到全连接层。具体如下图所示。

全连接层也需要重新建立一个模型，输入是flatten之后的输入，输出是softmax层的输出。这是一个简单的小模型。

在这里提供一个把训练好的模型参数，读取到另外一个模型中的代码

#提取特征的大模型
def read_big_model(inputs):
# 第一个卷积和最大池化层
X = Conv2D(16, (3, 3), name="conv2d_1")(inputs)
X = BatchNormalization(name="batch_normalization_1")(X)
X = Activation('relu', name="activation_1")(X)
X = MaxPooling2D(pool_size=(2, 2), strides=(2, 2), name="max_pooling2d_1")(X)
# google_inception模块
conv_1 = Conv2D(32, (1, 1), padding='same', name='conv2d_2')(X)
conv_1 = BatchNormalization(name='batch_normalization_2')(conv_1)
conv_1 = Activation('relu', name='activation_2')(conv_1)
conv_2 = Conv2D(32, (3, 3), padding='same', name='conv2d_3')(X)
conv_2 = BatchNormalization(name='batch_normalization_3')(conv_2)
conv_2 = Activation('relu', name='activation_3')(conv_2)
conv_3 = Conv2D(32, (5, 5), padding='same', name='conv2d_4')(X)
conv_3 = BatchNormalization(name='batch_normalization_4')(conv_3)
conv_3 = Activation('relu', name='activation_4')(conv_3)
pooling_1 = MaxPooling2D(pool_size=(2, 2), strides=(1, 1), padding='same', name='max_pooling2d_2')(X)
X = merge([conv_1, conv_2, conv_3, pooling_1], mode='concat', name='merge_1')
X = MaxPooling2D(pool_size=(2, 2), strides=(2, 2), name='max_pooling2d_3')(X) # 这里的尺寸变成16x16x112
X = Conv2D(64, (3, 3), kernel_regularizer=regularizers.l2(0.01), padding='same', name='conv2d_5')(X)
X = BatchNormalization(name='batch_normalization_5')(X)
X = Activation('relu', name='activation_5')(X)
X = MaxPooling2D(pool_size=(2, 2), strides=(2, 2), name='max_pooling2d_4')(X) # 这里尺寸变成8x8x64
X = Conv2D(128, (3, 3), padding='same', name='conv2d_6')(X)
X = BatchNormalization(name='batch_normalization_6')(X)
X = Activation('relu', name='activation_6')(X)
X = MaxPooling2D(pool_size=(2, 2), strides=(2, 2), padding='same', name='max_pooling2d_5')(X) # 这里尺寸变成4x4x128

return X

def read_big_model_classify(inputs_sec):
X_ = Flatten(name='flatten_1')(inputs_sec)
X_ = Dense(256, activation='relu', name="dense_1")(X_)
X_ = Dropout(0.5, name="dropout_1")(X_)
predictions = Dense(2, activation='softmax', name="dense_2")(X_)
return predictions
#建立的小模型

inputs=Input(shape=(512,512,3))
X=read_big_model(inputs)#读取训练好模型的网络参数
#建立第一个model
model=Model(inputs=inputs, outputs=X)
model.load_weights('model_halcon.h5', by_name=True)

五、识别定位结果

上述的滑窗方式可以定位到原图像，8x8的滑窗定位到原图就是64x64，同样，在原图中根据滑窗方式不同（在这里选择的是左右和上下的步长为16个像素）识别定位到的缺陷位置也不止一个，这样就涉及到定位精度了。在这里选择投票的方式，其实就是对原图像上每个被标记的像素位置进行计数，当数字大于指定的阈值，就被判断为缺陷像素。

识别结果如下图所示：

六、一些Trick

对上述案例来说，其实64x64大小的定位框不够准确，可以考虑训练一个32x32大小的模型，然后应用方式和64x64的模型相同，最后基于32x32的定位位置和64x64的定位位置进行投票，但是这会涉及到一个问题，就是时间上会增加很多，要慎用。

对背景和前景相差不大的时候，网络尽量不要太深，因为太深的网络到后面基本学到的东西都是相同的，没有很好的区分能力，这也是我在这里为什么不用object detection的原因，这些检测模型网络，深度动辄都是50+，效果反而不好，虽然有残差模块作为backbone。

但是对背景和前景相差很大的时候，可以选择较深的网络，这个时候，object detection方式就派上用场了。

文章来源：CSDN Tom Hardy

温馨提示：

因最近微信公众平台推送规则改变，很多读者反馈没有及时看到更新的文章。根据最新规则，建议多点击“推荐阅读、分享、收藏”等，成为常读用户。

热门文章推荐：点击直接进入相关文章：

001：计算机视觉领域研究资源及期刊、会议介绍

003：120图勾勒全球AI产业完整图谱!

004：Facebook 开源计算机视觉系统，从像素水平理解图像（附论文及代码）

005：想成为机器学习工程师？这份自学指南你值得收藏

006：十一种通用滤波算法

007：图像处理与计算机视觉基础，经典以及最近发展

008：机器人行业深度报告（完整版）

009：从洗衣妹到谷歌首席科学家，她靠孤独改变了人工智能界！

010：工业级机器视觉行业研究报告

011：双远心工业镜头的原理简述

012：如何装备一个学术型的 iPad ？

013：机器视觉系统概述

015：为什么最好的机械臂是7个自由度，而不是6个？

016：史上最给力的技术视频！

017：机器人10大流行编程语言对比，你掌握了哪种？

018：新奇复杂机械原理图！

021：光源选型知识点
 022：这才是机械手，这才是自动化，你那算什么？
023：摄像机和镜头的基础知识
024：物联网产业链全景图（附另13大电子行业全景图，必收藏）
025：日本到底强大到什么地步？让人窒息！看后一夜未眠
 026：德国机械用行动惊艳全世界：无敌是多么寂寞

一切有为法，如梦幻泡影，如露亦如电，应作如是观！

欢迎转发、留言、点赞、分享，感谢您的支持！

机器视觉检测

机器视觉，工业自动化，工业机器人领域的新媒体平台：工业自动化,机器人,机器视觉应用案例,行业展会,机器视觉系统,机器视觉软件技术算法,机器视觉光源,视觉检测,工业相机,工业镜头,图像采集卡,三维视觉技术,三维测量技术,工业4.0

最新文章

降薪入职后，我悔不当初...

机器视觉在交通中的应用总结

基于机器视觉的安全气囊检测系统研究

CV顶会CVPR收了一篇论文：没算法没实验，全靠idea思路好...

为啥本科生都能发顶刊，而博士一篇都没有？

3D机器视觉的技术路径和场景适用

2024/25 财年计算机视觉行业：趋势和预测

什么是缺陷检测？机器视觉表面缺陷检测方法

邀请函丨第21届天津工博会

十年磨一剑！成像领域跨时代技术突破！青年博士连发Nature！

【源码分享】视觉识别+缺陷检测+3D点云+深度学习

基于机器视觉的电池极耳检测系统应用

3D机器视觉的技术路径和场景适用

拉链头机器视觉检测的难点及解决方法？

轰动学界的重磅进展！光学成像携手顶尖思路，打破国际难题！

如何权衡CCD图像传感器的各类优缺点？

大地震！天才少年连发3篇视觉期刊！AI与成像杀疯了！

机器视觉三维光学成像法及应用

基于机器视觉的表面缺陷检测存在哪些问题与难点

只要敢捞“偏门”，篇篇都是顶会顶刊！

自适应视觉算法在表面缺陷检测中的应用

AI智能视觉检测技术在工业级测量领域的创新应用--AMB Tube-Q导管数字化测量系统

双偏振光源在机器视觉中的应用

凝“芯”聚力谋发展，SEMI-e 2024 第六届深圳国际半导体展即将盛大开幕！

45K*15薪，下半年机器视觉要这样搞钱！

分辨率和像素的计算方法

3D视觉检测案例分享：外观检测

盛会在即！6月26-28日，800+企业齐聚SEMI-e第六届深圳国际半导体展，海志亿诚邀参加

机器视觉缺陷检测之相机选取

长电、华天、华力、北方华创、盛美等800+企业齐聚SEMI-e第六届深圳国际半导体展，附参会名单！

深入浅出各种边缘检测算子及推导

35K*15薪！现在视觉搞钱是真的猛...

AI智能视觉检测技术在工业级测量领域的创新应用--AMB Tube-Q导管数字化测量系统

自动控制方面的大牛们/2D圆盘跟随式AI涂胶视觉检测系统/点光谱弧面玻璃轮廓度检测

4月抢人啊，视觉岗位爆了...

机器视觉检测之光源打光技巧

40K*15薪，2024年视觉这样搞钱才对嘛！

双目立体视觉原理及技术全解析

搞视觉薪资卡在15K上不去，怎么自救？

机器视觉定位检测之前光源与背光源技术及应用

平均薪资17333元！这是不是视觉人的新机会？

机器视觉系列之尺寸检测基础

开年抢人啊，机器视觉岗位爆了...

机器视觉缺陷检测之相机选取

平均薪资17333元！这是不是视觉人的新机会？

入局AI，今后视觉想拿30k也能毫不费劲！

基于深度学习识别模型的缺陷检测

35K*15薪！这才是今年搞视觉的最佳选择！

使用图像分割来做缺陷检测的应用案例

机器视觉的图像目标识别方法

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉