如何使用深度学习进行缺陷检测

科技 2024-11-15 10:05 中国香港

点击上方“小白学视觉”，选择加"星标"或“置顶”

重磅干货，第一时间送达

机器学习自动检测异常已成为一个有着高度直接影响的有趣且具有潜力的研究领域，特别是在视觉检测领域。深度学习技术已成为此任务的最佳方法。深度学习技术可以通过训练图像数据集来提供一个可以检测表面异常的模型。

DAGM数据集中不同背景纹理上的表面缺陷

介绍

在一些工业中，通过SEM/EDX检查表面或检查材料中的杂质是质量控制的一步。通常，这个检查过程需要质量人员手动检查表面。

这需要训练QC检查员识别整个复杂缺陷范围。这是耗时、低效的，可能会导致生产等待时间，甚至偶尔错误分类缺陷，导致客户投诉或领域故障，从而导致产品召回。过去，传统的图像处理方法足以解决这些问题（Paniagua等人，2010；Bulnes等人，2016）。然而，工业4.0范例倾向于泛化生产线，需要快速适应新产品（Oztemel和Gursev，2018）。在本文中，我们探讨了基于2D卷积神经网络的U-Net架构来检测缺陷。

U-Net

UNET是由Olaf Ronneberger等人为生物医学图像分割开发的。该架构包含两条路径。第一条路径是收缩路径（也称为编码器），用于捕获图像的上下文。编码器只是传统的卷积和最大池化层堆栈。第二条路径是对称扩展路径（也称为解码器），用于使用转置卷积进行精确的定位。因此，它是一个端到端的，完全卷积的网络（FCN），即它只包含卷积层，不包含任何稠密层，因此它可以接受任何大小的图像。

在原始论文中，UNET描述如下：

数据集

给大家推荐一个缺陷检测的数据集，具体网址如下：https://conferences.mpi-inf.mpg.de/dagm/2007/prizes.html

这个数据集是人工生成的，但类似于真实世界的问题。它包含多个数据集，每个数据集包含1000个图像，显示没有缺陷的背景纹理和150个带有一个标记缺陷的背景纹理图像。单个数据集中的图像非常相似，但每个数据集是由不同的纹理模型和缺陷模型生成的。

并不是所有纹理偏差都是缺陷。算法将需要在训练阶段使用提供的弱标签来学习表征缺陷的属性。

Python库:

matplotlib xmltodict sklearn tensorflow scipy

克隆代码库

将代码库克隆到本地文件夹：

git clone https://github.com/AdarshGouda/Surface-Defect-Detection.gitcd Surface-Defect-Detection

helper函数将有助于定位缺陷并使用位于./utils文件夹中的椭圆遮罩它。此文件夹及其内容将根据需要在以下代码中导入。

下载数据集并解压缩:

wget https://resources.mpi-inf.mpg.de/conference/dagm/2007/Class1_def.zip

根据我们的网络连接性，数据集需要几分钟时间才能下载。

unzip -q Class1_def.zip -d .

让我们来看看./Class1_def文件夹中的图像。

请注意第一个图像1.png左上角的缺陷。./utils文件夹中的辅助函数将帮助定位图像中的这些缺陷并创建相应的掩模作为标签。

Surface-Defect-Detection.ipynb文件中的以下代码块将对您想要测试的任何图像绘制分割标签。在这里，我已经测试了第一个图像1.png。

DataIO.py脚本中的load_images_masks()函数从Class1_def文件夹中获取原始图像文件，并返回图像及其分割标签。

如上所示，共有150个大小为512 x 512且通道为1的图像（灰度图像而非RGB）。

接下来，让我们查看前两个数据点的X和y。

如上所示，分割标签正确地识别了原始图像中缺陷的位置。

训练测试的划分

定义一个简化版的U-net，以简化计算和训练。

损失函数和平滑的Dice系数：

对于图像分割任务，一个常见的损失函数是基于Dice系数的，它本质上是两个样本之间重叠的度量。这个度量的范围是从0到1，其中Dice系数为1表示完美且完全重叠。Dice系数最初是为二进制数据开发的，可以计算为：

其中|A∩B|表示集合A和B之间的公共元素，|A||A|表示集合A中元素的数量（对于集合B同样如此）。

对于预测分割掩码评估Dice系数的情况，我们可以将|A∩B||A∩B|近似为预测掩码和目标掩码的逐元素乘积，然后对结果矩阵求和。

因为我们的目标掩码是二进制的，所以我们有效地将不在目标掩码中“激活”的任何像素都置为零。对于剩余的像素，我们实际上是惩罚低置信度的预测；这个式子的更高值，也就是分子中的部分，会导致更好的Dice系数。

为了量化|A|和|B|，一些研究人员使用简单的求和，而其他研究人员更喜欢使用平方和来计算。我没有实践经验，不知道在各种任务中哪种方法表现更好，所以我让你们尝试两种方法，看哪种效果更好。

如果你好奇，那么在计算Dice系数的分子中有一个2，是因为我们的分母“双重计算”了两个集合之间的公共元素。为了制定可以最小化的损失函数，我们将使用1−Dice。这个损失函数被称为平滑的Dice损失，因为我们直接使用了预测概率，而不是将它们阈值化并将它们转换为二进制掩码。

关于神经网络输出，分子关注于我们的预测和目标掩码之间的公共激活，而分母关注于每个掩码中的激活数量。这就有了一个根据目标掩码的大小来归一化损失的效果，以便平滑的Dice损失不会在图像中具有较少空间表示的类中学习。

让我们定义smooth_dice_coeff()函数来计算损失并编译模型：

训练

在接下来的部分，我们将看到作者在这个项目中的训练结果和测试效果。作者选择了批量大小为10和60个epochs。批量大小为10有助于在RTX3070（笔记本电脑）上运行训练。学习曲线表现不错，没有欠拟合或过拟合的迹象，这是一个好兆头。

测试

接下来我们使用 predict_evaulation() 函数来检查测试集上的结果。

结论

这个项目更多是一个概念的证明，训练图像是人工生成的。在现实世界中，从相机或数字显微镜获得的图像可能具有不同的对比度或亮度值，这可能会使缺陷检测变得困难。在训练过程中使用数据增强技术可能有助于为真实的工业应用程序准备训练模型。在这篇文章中，结果比作者预想的要好。

参考文献：

U-Net: 用于生物医学图像分割的卷积网络 https://arxiv.org/abs/1505.04597
Tabernik，D.，Šela，S.，Skvarč，J.等。基于分割的深度学习方法用于表面缺陷检测。J Intell Manuf 31，759-776（2020）。https://doi.org/10.1007/s10845-019-01476-x
NVIDIA端到端深度学习平台
The One Hundred Layers Tiramisu：全卷积密集网络用于语义分割 https://arxiv.org/abs/1611.09326
智能制造中的边缘人工智能：缺陷检测及其它应用

下面附上UNet网络的代码

def conv2d_block(input_tensor, n_filters, kernel_size = 3, batchnorm = True):    """Function to add 2 convolutional layers with the parameters passed to it"""    # first layer    x = Conv2D(filters = n_filters, kernel_size = (kernel_size, kernel_size),\              kernel_initializer = 'he_normal', padding = 'same')(input_tensor)    if batchnorm:        x = BatchNormalization()(x)    x = Activation('relu')(x)
    # second layer    x = Conv2D(filters = n_filters, kernel_size = (kernel_size, kernel_size),\              kernel_initializer = 'he_normal', padding = 'same')(input_tensor)    if batchnorm:        x = BatchNormalization()(x)    x = Activation('relu')(x)
    return x
  def get_unet(input_img, n_filters = 16, dropout = 0.1, batchnorm = True):    # Contracting Path    c1 = conv2d_block(input_img, n_filters * 1, kernel_size = 3, batchnorm = batchnorm)    p1 = MaxPooling2D((2, 2))(c1)    p1 = Dropout(dropout)(p1)
    c2 = conv2d_block(p1, n_filters * 2, kernel_size = 3, batchnorm = batchnorm)    p2 = MaxPooling2D((2, 2))(c2)    p2 = Dropout(dropout)(p2)
    c3 = conv2d_block(p2, n_filters * 4, kernel_size = 3, batchnorm = batchnorm)    p3 = MaxPooling2D((2, 2))(c3)    p3 = Dropout(dropout)(p3)
    c4 = conv2d_block(p3, n_filters * 8, kernel_size = 3, batchnorm = batchnorm)    p4 = MaxPooling2D((2, 2))(c4)    p4 = Dropout(dropout)(p4)
    c5 = conv2d_block(p4, n_filters = n_filters * 16, kernel_size = 3, batchnorm = batchnorm)
    # Expansive Path    u6 = Conv2DTranspose(n_filters * 8, (3, 3), strides = (2, 2), padding = 'same')(c5)    u6 = concatenate([u6, c4])    u6 = Dropout(dropout)(u6)    c6 = conv2d_block(u6, n_filters * 8, kernel_size = 3, batchnorm = batchnorm)
    u7 = Conv2DTranspose(n_filters * 4, (3, 3), strides = (2, 2), padding = 'same')(c6)    u7 = concatenate([u7, c3])    u7 = Dropout(dropout)(u7)    c7 = conv2d_block(u7, n_filters * 4, kernel_size = 3, batchnorm = batchnorm)
    u8 = Conv2DTranspose(n_filters * 2, (3, 3), strides = (2, 2), padding = 'same')(c7)    u8 = concatenate([u8, c2])    u8 = Dropout(dropout)(u8)    c8 = conv2d_block(u8, n_filters * 2, kernel_size = 3, batchnorm = batchnorm)
    u9 = Conv2DTranspose(n_filters * 1, (3, 3), strides = (2, 2), padding = 'same')(c8)    u9 = concatenate([u9, c1])    u9 = Dropout(dropout)(u9)    c9 = conv2d_block(u9, n_filters * 1, kernel_size = 3, batchnorm = batchnorm)
    outputs = Conv2D(1, (1, 1), activation='sigmoid')(c9)    model = Model(inputs=[input_img], outputs=[outputs])    return model

下载1：OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复：扩展模块中文教程，即可下载全网第一份OpenCV扩展模块教程中文版，涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。

下载2：Python视觉实战项目52讲

在「小白学视觉」公众号后台回复：Python视觉实战项目，即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目，助力快速学校计算机视觉。

下载3：OpenCV实战项目20讲

在「小白学视觉」公众号后台回复：OpenCV实战项目20讲，即可下载含有20个基于OpenCV实现20个实战项目，实现OpenCV学习进阶。

交流群

欢迎加入公众号读者群一起和同行交流，目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群（以后会逐渐细分），请扫描下面微信号加群，备注：”昵称+学校/公司+研究方向“，例如：”张三 + 上海交大 + 视觉SLAM“。请按照格式备注，否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告，否则会请出群，谢谢理解~

http://mp.weixin.qq.com/s?__biz=MzU0NjgzMDIxMQ==&mid=2247626446&idx=1&sn=2e04993768cd7678f0b5736b2b31f884

小白学视觉

哈工大在读博士的公众号，《OpenCV 4快速入门》的作者，面向初学者介绍计算机视觉基础知识、OpenCV使用、SLAM技术，深度学习等内容。

最新文章

招生信息 | 香港科技大学（广州）丁宁宁教授实验室博士招生

十个python图像处理工具

实践教程｜扩散模型代码复现

使用PyTorch进行知识蒸馏的代码示例

中文版的TPAMI，你听说过么！

招生信息 | 新泽西理工学院计算学院信息学系Dr. Chenxi Yuan 招募博士

如何消除摄影中的运动模糊?

漂亮，LSTM模型结构的可视化

目标检测和感受野的总结和想法

目标检测中的框位置优化总结

如何看待神经网络的黑箱？

如何使用深度学习进行缺陷检测

深度学习的图原理

饶毅：中国存在大量粗制滥造研究生的问题，很多博士不合格

路面语义分割

招生信息 | Emory大学计算机科学系Dr. Guo Zhichun实验室博士生招生

深度学习中的Normalization你懂了多少？

神经网络与傅立叶变换到底有没有关系？

从零开始构建DINO模型与PyTorch：自监督视觉transformer

涨点神器！100个即插即用缝合模块【合集下载】

深度学习最常用的10个激活函数！（数学原理+优缺点）

招生信息 | 香港城市大学计算机科学系Dr. Luo Yuhan诚邀加入BiWell实验室

实操教程｜PyTorch实现断点继续训练

又一本开源免费的大模型书来了，449页pdf！

有哪些东西是你读博士以后才懂的？

图像处理常用算法(基础)

少样本学习综述：技术、算法和模型

学术 | 热议：寒门硕士要不要继续读博士？

怎么才能优雅地向博士导师表达「这周科研没什么进展」？

医学影像相关开源数据集资源汇总

顶刊解读 TRGS | 位置-时间感知Transformer用于遥感变化检测

去他的顶会顶刊！我就想发个论文毕个业！

五年之内，博士会像今天的硕士一样井喷吗？

Gemini 可以进行目标检测了！

形象理解二维傅里叶变换

Halcon和Opencv 的区别

PyTorch常用代码段合集

cuda编程：我的第一份cuda代码

系统性总结了 Numpy 所有关键知识点！

图像特征提取与匹配技术

EMF-former：一种用于医学图像分割的高效且内存友好的Transformer

一位上海交大教授的深度学习五年研究总结

软包装锂离子电池的表面凸点缺陷检测

长远看算法岗真的比开发岗香吗？

GASA-UNet：用于医学图像分割的全局轴向自注意力U-Net

招生信息 | 香港大学杜泓阳教授团队博士招生

Python特征重要性分析的9个常用方法

245个目标检测开源项目合集，建议收藏！

用Windows电脑训练深度学习模型？超详细配置教程来了

为什么建议大家使用 Linux 开发？真的很很很优雅！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉