使用图像分割来做缺陷检测的应用案例

科技 2024-01-28 23:52 泰国

微信改了推送规则，如果您还想收到我们的推送！

点击上方“机器视觉”，右上角...选择“置顶/星标”公众号

作者：Vinithavn

编译：ronghuaiyang

一个简单的例子，详细的过程和代码说明。

1. 介绍

什么是物体检测？

给定一张图像，我们人类可以识别图像中的物体。例如，我们可以检测图像中是否有汽车，树木，人等。如果我们可以分析图像并检测物体，我们可以教机器做同样的事情吗?

答案是肯定的。随着深度学习和计算机视觉的兴起，我们可以实现目标检测的自动化。我们可以建立深度学习和计算机视觉模型，可以检测和定位目标，计算它们之间的距离，预测它们的未来的位置等。目标检测在计算机视觉和机器学习中有着广泛的应用。目标跟踪、闭路电视监控、人类活动识别，甚至自动驾驶汽车都利用了这项技术。为了更好地理解它，考虑下面的图片。

图1，路面交通的物体检测

图中为一幅道路交通图像从车辆上看的目标检测。这里我们可以看到它正在检测其他车辆，交通信号等。如果车辆是自动驾驶汽车，应该能够检测到行驶路径、其他车辆、行人、交通信号等，以便平稳、安全驾驶。

现在我们已经了解了目标检测，让我们转移到一个稍微高级的技术，称为图像分割。通过分析下图，我们可以很容易地理解目标检测和图像分割之间的区别。

图2，目标检测和图像分割

这两种方法都试图识别和定位图像中的物体。在目标检测中，这是通过边界框实现的。该算法或模型将通过在目标周围绘制一个矩形边界框来定位目标。在图像分割中，对图像中的每个像素进行标注。这意味着，给定一幅图像，分割模型试图通过将图像的所有像素分类成有意义的对象类别来进行像素级分类。这也被称为密集预测，因为它通过识别和理解每个像素属于什么对象来预测每个像素的含义。

“图像分割的返回格式称为掩码：一个与原始图像大小相同的图像，但对于每个像素，它只有一个布尔值指示目标是否存在。“

我们将在本案例研究中使用这种技术。现在我们有了目标检测和图像分割的概念。让我们进一步理解问题陈述。

2. 问题陈述

我们得到了一些产品的图像。有些产品有缺陷，有些没有。考虑到产品的图像，我们需要检测它是否有缺陷。我们还需要定位这个缺陷。

3. 机器学习的形式

这个问题可以表述为图像分割任务。给定一个产品的图像，我们需要为其绘制分割掩模。如果产品有缺陷，分割图应该能够定位该缺陷。

4. 性能度量

在分割问题中最常用的指标之一是(IoU分数。参考下面的图像，这清楚地显示了如何IoU分数是计算的。

IoU是预测分割与真实分割的重叠面积除以预测分割与原始分割的并集面积

我们也可以把IoU分数写成TP/TP+FN+FP。

这个度量值的范围是0到1。Iou得分为1表示完全重叠，Iou得分为0表示完全不重叠。

本案例研究中使用的损失函数是Dice损失。Dice 损失可以被认为是1-Dice 系数，其中Dice 系数定义为，

Dice系数 = 2 * 相交的重叠面积

5. 理解数据

该数据集包含两个文件夹 —— train和test。训练集由六类图像组成。每一类图像被分成两个文件夹，其中一个文件夹包含1000张无缺陷图像，另一个文件夹包含130张有缺陷图像。下图显示了train文件夹中的文件夹。

图3，训练数据集

以 “def”结尾的文件夹名称包含相应类的有缺陷的图像，没有“def”的则表示无缺陷的图像。测试文件夹包含一组120个有缺陷的图像，这些图像的分割图将被预测。

6. 数据预处理

6.1 准备图像数据和分割蒙版

现在我们需要为每个图像准备图像数据和相应的分割掩模。我们把图片分成十二个文件夹。让我们来看一些图片。

图4，产品的图像

第一幅图像表示有缺陷的产品，第二幅图像表示无缺陷的图像。现在我们需要为这些图像准备分割图。分割图可以检测出图像中有缺陷的部分。对于上面的图像，预期的分割图是这样的。

图5，图4上的分割蒙版

我们可以看到，在第一幅图像中，椭圆区域代表检测部分。第二幅图像是空白的，因为它没有缺陷。

让我们再分析一些有缺陷的图像。

图6，一些缺陷图像的例子

我们可以看到缺陷在图像中以曲线或直线的形式出现。因此，我们可以利用椭圆来将这些区域标记为缺陷。

但我们如何准备分割掩码？是否需要手工标注？

我们有另一个包含关于分割掩码信息的文件。

每一行包含关于图像的mask区域的信息。每一列表示图像的文件名、椭圆的半长轴、椭圆的半短轴、椭圆的旋转角度、椭球中心的x位置、椭球中心的y位置。

绘制椭圆所需的数据是使用get_data函数获得的，如下所示：

我们可以使用这些信息，并使用skimage函数绘制一个椭圆分割蒙版。

值得注意的是，这只适用于有缺陷的图像。对于无缺陷的图像，我们需要创建空白图像作为分割掩模。

6.2 加载图像

结构化数据以如下所示的形式获得。

“images”列包含每个图像的完整文件路径，“mask”列包含相应的掩码图像。

下一步是加载数据。

7. 模型

现在我们得到了所有的数据，下一步是找到一个模型，可以生成图像的分割mask。让我来介绍一下UNet模型，它在图像分割任务中非常流行。

UNet架构包含两种路径：收缩路径和扩展路径。下图可以更好地理解Unet架构。

图7，Unet结构

模型结构类似于英文字母“U”，因此得名Unet。模型的左侧包含收缩路径(也称为编码器)，它有助于捕获图像中的上下文。该编码器只是一个传统的卷积和最大池层堆栈。在这里我们可以看到，池化层降低了图像的高度和宽度，增加了通道的深度和数量。在收缩路径的末端，模型将理解图像中出现的形状、模式、边缘等，但它丢失了“在哪里”出现的信息。

由于我们的问题是获取图像的分割映射，我们从压缩路径中获得的信息是不够的。我们需要一个高分辨率的图像作为输出，其中所有像素都是分类的。

”如果我们使用一个规则的卷积网络，pooling层和dense层，我们会丢失WHERE信息，只保留不是我们想要的“WHAT”信息。在分割的情况下，我们既需要“WHAT”信息，也需要“WHERE”信息。

所以我们需要对图像进行上采样，以保留“where”信息。这是在右边的扩张路径中完成的。扩展路径(也称为解码器)用于使用上采样技术定位捕获的上下文。上采样技术有双线性插值法、最近邻法、转置卷积法等。

8. 训练

现在我们已经准备好了所有的训练数据，也确定了模型。现在让我们训练模型。

由于无缺陷图像的数量远远高于有缺陷图像的数量，所以我们只从无缺陷图像中提取一个样本，以获得更好的结果。采用adam优化器训练模型，并以dice 损失为损失函数。

使用的性能指标是iou分数。

经过10个epoch，我们能够获得0.98的iou分数和0.007的骰子损失，这是相当不错的。让我们看一些图像的分割图。

我们可以看到，该模型能够预测类似于原始分割图的分割图。

9. 测试数据分割图的预测

现在让我们尝试解决手边的问题，即预测和绘制测试图像的分割蒙版。下图显示了一些测试图像的预测分割图。

可以看出，该模型具有良好的测试性能，能够检测出测试图像中的缺陷。

10. 未来的工作

如上所述，与无缺陷图像相比，有缺陷图像的数量非常少。因此，对缺陷图像采用上采样和增强技术可以改善训练效果。

温馨提示：

因最近微信公众平台推送规则改变，很多读者反馈没有及时看到更新的文章。根据最新规则，建议多点击“推荐阅读、分享、收藏”等，成为常读用户。

热门文章推荐：点击直接进入相关文章：

001：计算机视觉领域研究资源及期刊、会议介绍

003：120图勾勒全球AI产业完整图谱!

004：Facebook 开源计算机视觉系统，从像素水平理解图像（附论文及代码）

005：想成为机器学习工程师？这份自学指南你值得收藏

006：十一种通用滤波算法

007：图像处理与计算机视觉基础，经典以及最近发展

008：机器人行业深度报告（完整版）

009：从洗衣妹到谷歌首席科学家，她靠孤独改变了人工智能界！

010：工业级机器视觉行业研究报告

011：双远心工业镜头的原理简述

012：如何装备一个学术型的 iPad ？

013：机器视觉系统概述

015：为什么最好的机械臂是7个自由度，而不是6个？

016：史上最给力的技术视频！

017：机器人10大流行编程语言对比，你掌握了哪种？

018：新奇复杂机械原理图！

021：光源选型知识点
 022：这才是机械手，这才是自动化，你那算什么？
023：摄像机和镜头的基础知识
024：物联网产业链全景图（附另13大电子行业全景图，必收藏）
025：日本到底强大到什么地步？让人窒息！看后一夜未眠
 026：德国机械用行动惊艳全世界：无敌是多么寂寞

一切有为法，如梦幻泡影，如露亦如电，应作如是观！

欢迎转发、留言、点赞、分享，感谢您的支持！

机器视觉检测

机器视觉，工业自动化，工业机器人领域的新媒体平台：工业自动化,机器人,机器视觉应用案例,行业展会,机器视觉系统,机器视觉软件技术算法,机器视觉光源,视觉检测,工业相机,工业镜头,图像采集卡,三维视觉技术,三维测量技术,工业4.0

最新文章

降薪入职后，我悔不当初...

机器视觉在交通中的应用总结

基于机器视觉的安全气囊检测系统研究

CV顶会CVPR收了一篇论文：没算法没实验，全靠idea思路好...

为啥本科生都能发顶刊，而博士一篇都没有？

3D机器视觉的技术路径和场景适用

2024/25 财年计算机视觉行业：趋势和预测

什么是缺陷检测？机器视觉表面缺陷检测方法

邀请函丨第21届天津工博会

十年磨一剑！成像领域跨时代技术突破！青年博士连发Nature！

【源码分享】视觉识别+缺陷检测+3D点云+深度学习

基于机器视觉的电池极耳检测系统应用

3D机器视觉的技术路径和场景适用

拉链头机器视觉检测的难点及解决方法？

轰动学界的重磅进展！光学成像携手顶尖思路，打破国际难题！

如何权衡CCD图像传感器的各类优缺点？

大地震！天才少年连发3篇视觉期刊！AI与成像杀疯了！

机器视觉三维光学成像法及应用

基于机器视觉的表面缺陷检测存在哪些问题与难点

只要敢捞“偏门”，篇篇都是顶会顶刊！

自适应视觉算法在表面缺陷检测中的应用

AI智能视觉检测技术在工业级测量领域的创新应用--AMB Tube-Q导管数字化测量系统

双偏振光源在机器视觉中的应用

凝“芯”聚力谋发展，SEMI-e 2024 第六届深圳国际半导体展即将盛大开幕！

45K*15薪，下半年机器视觉要这样搞钱！

分辨率和像素的计算方法

3D视觉检测案例分享：外观检测

盛会在即！6月26-28日，800+企业齐聚SEMI-e第六届深圳国际半导体展，海志亿诚邀参加

机器视觉缺陷检测之相机选取

长电、华天、华力、北方华创、盛美等800+企业齐聚SEMI-e第六届深圳国际半导体展，附参会名单！

深入浅出各种边缘检测算子及推导

35K*15薪！现在视觉搞钱是真的猛...

AI智能视觉检测技术在工业级测量领域的创新应用--AMB Tube-Q导管数字化测量系统

自动控制方面的大牛们/2D圆盘跟随式AI涂胶视觉检测系统/点光谱弧面玻璃轮廓度检测

4月抢人啊，视觉岗位爆了...

机器视觉检测之光源打光技巧

40K*15薪，2024年视觉这样搞钱才对嘛！

双目立体视觉原理及技术全解析

搞视觉薪资卡在15K上不去，怎么自救？

机器视觉定位检测之前光源与背光源技术及应用

平均薪资17333元！这是不是视觉人的新机会？

机器视觉系列之尺寸检测基础

开年抢人啊，机器视觉岗位爆了...

机器视觉缺陷检测之相机选取

平均薪资17333元！这是不是视觉人的新机会？

入局AI，今后视觉想拿30k也能毫不费劲！

基于深度学习识别模型的缺陷检测

35K*15薪！这才是今年搞视觉的最佳选择！

使用图像分割来做缺陷检测的应用案例

机器视觉的图像目标识别方法

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉