工业缺陷检测中数据标注需要注意的几个事项

文摘 2024-11-06 07:45 重庆

点击下方卡片，关注“OpenCV与AI深度学习”

视觉/图像重磅干货，第一时间送达

在工业场景中，网络结构决定了下限，数据决定着上限，要想模型有好的表现，数据是至关重要的。下面就这个项目来说一说，工业缺陷检测在标注数据时需要注意的几个事项：

1、离得比较近的缺陷就合并在一个框里

以上两个图里的缺陷都是可以合并的，一是为了保持缺陷的完整性，同一个缺陷被标注成好多个，会给神经网络造成误解，同时也避免出现多个小目标。

2、尽量不要有太细长的目标

神经网络的卷积基本上都是3*3的，而且先验框anchor在设计宽高比时一般也是在1左右，回归非常细长的目标，需要比较大的感受野和宽高比，不一定能做得很好。如图左边那块目标，可以合并一下，稍微标大一点，把长宽比例搞得居中一点。

3、不要打太小的目标，比如低于10x10像素的

模型一般都对小目标不敏感，除非采用比较好的trick，就拿YOLOv4来说，到第三次下采样的特征图才拿去后面做检测，也就是在原图上最小都有8个像素，才能在特征图上体现为1个像素。有人会杠了，那我的目标就是小目标啊，小哥，我说了，另外还有很多trick的，不在本文讨论范围，打标签这个环节你要么打大点，要么不要打，或者把局部区域放大成大图，再打标签，不然送到模型里头，也是没用的。这跟严谨不严谨没有任何关系。

YOLOv4网络结构图

4、不要标注特别不明显的特征

这一条相信都能理解，特征连人都认不出来，哪个网络都不好识别吧。像这种标注框，恐怕谁都不好认吧。

5、框的位置尽量准确一点，把缺陷部分刚好框进去

像右下角那个框，完全可以打大点吧。

6、需要检测的缺陷在训练集中至少要出现一次相似的

另外，需要多说一句，跟标注无关的。就是虽然都是缺陷，但实际上也分很多种的，如果训练集里都没有出现过相似的，就基本上别指望测试时能够检测出来了。比如下图中，虽然只划分了一类缺陷，但是从特征的角度来说，实际上已经是好几类了，比如划痕、凸起、裂开。还是回到开头那句话：网络结构决定了下限，数据决定上限。目前的技术，不靠大量的数据喂，是训练不出很好的模型的。

本文仅做学术分享，如有侵权，请联系删文。

—THE END—

觉得有用，麻烦给个赞和在看

http://mp.weixin.qq.com/s?__biz=MzU5NDM1MjU5Mg==&mid=2247510396&idx=1&sn=43a17bf7e3d45c40a6c8664ce8c45b20

OpenCV与AI深度学习

专注计算机视觉、深度学习和人工智能领域干货、应用、行业资讯的分享交流！

最新文章

实战 | OpenCV两种不同方法实现粘连大米分割计数(步骤 + 代码)

如何使用 YOLOv11 分割对象

基于YoloV8的药丸/片剂类型识别

使用OpenCV检测并计算直线角度

基于深度学习的轮胎缺陷检测系统

一文带你了解X-Ray点料机原理与应用

245个目标检测开源项目合集，建议收藏！

使用OpenCV实现球跟踪和落点预测

使用YoloV8检测PCB元件

OpenCV4.8 GPU版本CMake编译详细步骤与CUDA代码演示

轻松入门数字图像处理，搞定OpenCV编程！【文末送书】

YOLOv11在自定义数据集上训练做实例分割

仅用CPU就能跑到1000FPS，这是开源的C++跨平台人脸检测项目

单目实现车辆测距的方法

工业缺陷检测中数据标注需要注意的几个事项

实战 | 粘连物体分割与计数应用--密集粘连药片分割+计数案例

涨点神器！100个即插即用缝合模块【合集下载】

OpenCV实战 | 低对比度缺陷检测应用实例--LCD屏幕脏污检测

顶会新方向！全新多模态大模型统一分割框架

实战 | 基于YOLOv9和OpenCV实现车辆跟踪计数（步骤 + 源码）

实战 | 基于YOLOv8和OpenCV实现车速检测(详细步骤 + 代码)

OpenCV无缝融合应用--指定目标颜色改变(附C++源码)

今年顶会这情况。。。大家还是提前做准备吧！

超越YOLOv10/11、RT-DETRv2/3！中科大D-FINE重新定义边界框回归任务

完爆YOLO家族？新一代目标检测器又有新突破！

改动一行代码，PyTorch训练三倍提速，这些「高级技术」是关键

最强总结，99个时间序列+时空数据的顶会创新！

Ubuntu24.04 安装 OpenCV4.10.0 和CUDA12.6

基于YoloV11自定义数据集实现车辆事故检测

OpenCV实现保险丝颜色识别（附源码）

我发现了水CV顶会的最强套路，真的不需要脑子

OpenCV快速傅里叶变换(FFT)用于图像和视频流的模糊检测

实战 | 使用姿态估计算法构建简单的健身训练辅助应用程序

计算机视觉开发者都应掌握的10个必备工具

70G 项目文件 100 帧稳定运行？NVIDIA RTX™ 5000 Ada 性能跑分远超上一代！

实战 | OpenCV中更稳更快的找圆方法--EdgeDrawing使用演示（详细步骤 + 代码）

实战 | 用Python和MediaPipe搭建一个嗜睡检测系统 (详细步骤 + 源码)

245个目标检测开源项目合集，建议收藏！

YOLOv8预测参数详解（全面详细、重点突出、大白话阐述小白也能看懂）

又一本开源免费的大模型书来了，449页pdf！

60行代码训练/微调 Segment Anything 2 (SAM 2)

视觉算法岗，Kaggle金牌和CCF A一作哪个更有用？

YOLOv11 C++ TensorRT项目使用

实战 | YOLO11自定义数据集训练实现缺陷检测 (标注+训练+预测保姆级教程)

Python和C++中使用并行计算增强图像处理能力

PaddleOCR 2.9 发布，正式开源文本图像智能分析利器

实战｜OpenCV实时弯道检测(详细步骤+源码)

基于Segformer实现PCB缺陷检测(步骤 + 代码)

导师抢一作已成潜规则？牛马哭了。。。

重磅：PyCharm成为OpenCV官方IDE

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉