基于Segformer实现PCB缺陷检测(步骤 + 代码)

文摘科技 2024-10-18 07:45 重庆

点击下方卡片，关注“OpenCV与AI深度学习”

视觉/图像重磅干货，第一时间送达！

导读

本文主要介绍基于Segformer实现PCB缺陷检测，并给出步骤和代码。

背景介绍

PCB缺陷检测是电子制造的一个重要方面。利用Segformer等先进模型不仅可以提高准确性，还可以大大减少检测时间。传统方法涉及手动检查，无法扩展且容易出错。利用机器学习，特别是 Segformer模型，提供自动化且精确的解决方案。

实现步骤

下面是具体步骤：

【1】安装所需环境。首先，我们安装所需的库。其中，albumentations用于数据增强，transformers允许访问 Segformer等预训练模型，并xmltodict帮助解析数据集的XML注释。

pip install evaluate albumentations transformers accelerate xmltodict

【2】数据集。这个项目中使用的数据集由Roboflow提供。可以从下面链接获取：

https://universe.roboflow.com/diplom-qz7q6/defects-2q87r/dataset/16

该数据集分为测试文件夹和训练文件夹，由XML格式的图像及其相应注释组成。

# Create train and test setstrain_folder = "drive/..../train/images/"test_folder = "drive/.../validation/images/"
train_img_paths = sorted([train_folder + f for f in os.listdir(train_folder) if f.endswith("jpg")])test_img_paths = sorted([test_folder + f for f in os.listdir(test_folder) if f.endswith("jpg")])train_xml_paths = [f[:-3] + "xml" for f in train_img_paths]test_xml_paths = [f[:-3] + "xml" for f in test_img_paths]
train_ds = {"image_paths": train_img_paths, "xml_paths": train_xml_paths}test_ds = {"image_paths": test_img_paths, "xml_paths": test_xml_paths}

XML文件包含多边形标注信息，指示PCB图像上缺陷的位置。该函数process_mask读取XML标注信息并将其转换为掩码（类似图像的数组）。该掩模对应于PCB图像上的缺陷区域，基本上将缺陷与电路板的其余部分分开。

该函数首先使用OpenCV读取原始图像。在我们初始化与输入图像大小相同的蒙版之后。根据可视化标志，蒙版可以是3通道RGB蒙版（如彩色图像）或1通道灰度蒙版。最初，该掩码中的所有值都设置为零，这意味着没有缺陷。

【3】缺陷标注解析。对于每个缺陷标注信息：识别缺陷类型，提取缺陷的多边形形状，该多边形被绘制到初始化的蒙版上。最后，该函数弥合了XML标注信息和适合训练的格式之间的差距。给定 PCB图像及其相应的XML 注释，它会生成一个分割掩模，突出显示有缺陷的区域。掩模可以是适合训练模型的数字格式，也可以是用于人工检查的视觉格式。

def process_mask(img_path, xml_path, visualize=False):    img = cv2.imread(img_path)    num_dim = 3 if visualize else 1    mask = np.zeros((img.shape[0], img.shape[1], num_dim))
    # Read xml content from the file    with open(xml_path, "r") as file:      xml_content = file.read()
    data = xmltodict.parse(xml_content)
    # If has defect mask    if "object" in data["annotation"]:        objects = data["annotation"]["object"]
        # Single defects are annotated as a single dict, not a list        if not isinstance(objects, List):          objects = [objects]
        for obj in objects:          defect_type = obj["name"]          polygon = obj["polygon"]          poly_keys = list(polygon.keys())
          # Get number of (x, y) pairs - polygon coords          poly_keys = [int(k[1:]) for k in poly_keys]          num_poly_points = max(poly_keys)
          # Parse ordered polygon coordinates          poly_coords = []          for i in range(1, num_poly_points+1):              poly_coords.append([                  int(float(polygon[f"x{i}"])),                  int(float(polygon[f"y{i}"]))              ])          poly_coords = np.array(poly_coords)
          # Draw defect segment on mask          fill_color = color_map[defect_type] if visualize else id_cat_map[defect_type]          mask = cv2.fillPoly(mask, pts=[poly_coords], color=fill_color)
    #Optional    if visualize:        cv2.imwrite("output.jpg", mask)        mask = Image.open("output.jpg")
    return mask

【4】探索性数据分析。在训练模型之前，最好先了解数据。在这里，我们检查缺陷类型的分布并在样本图像上可视化缺陷。

缺陷热力图显示了常见的缺陷位置，箱线图显示了缺陷尺寸的分布。

该函数旨在通过读取边界框详细信息来计算 XML 注释中存在的每个缺陷的大小。

def get_defect_sizes(xml_paths):    sizes = []    for xml_path in xml_paths:        with open(xml_path) as f:            data = xmltodict.parse(f.read())            objects = []            if 'object' in data['annotation']:                objects = data['annotation']['object']            if not isinstance(objects, list):                objects = [objects]            for obj in objects:                bndbox = obj['bndbox']                width = int(bndbox['xmax']) - int(bndbox['xmin'])                height = int(bndbox['ymax']) - int(bndbox['ymin'])                sizes.append(width * height)    return sizes

最后，群图重点关注缺陷尺寸在整个数据集中的分布和扩散。

【5】数据增强。该albumentations库用于人为扩展训练数据集，有助于提高模型的泛化能力。唯一指定的增强是水平翻转，它将以 50% 的概率水平翻转图像。

transform = A.Compose([    A.HorizontalFlip(p=0.5)])

【6】图像预处理。将图像及其掩模预处理为适合Segformer模型的格式。

preprocessor = SegformerImageProcessor()

我们将定义一个继承自PyTorchDataset类的自定义数据集类。这个自定义数据集允许我加载和预处理 PCB 图像及其相应的缺陷掩模。

使用 OpenCV 加载图像。使用前面讨论的函数生成缺陷掩模process_mask。使用之前初始化的图像预处理图像及其掩模SegformerImageProcessor。此步骤将图像转换为张量格式，并确保它们具有适合 Segformer 模型的大小和标准化。返回预处理的图像和掩模张量。

class DefectSegmentationDataset(Dataset):  def __init__(self, dataset, mode):    self.image_paths = dataset["image_paths"]    self.xml_paths = dataset["xml_paths"]
  def __len__(self):    return len(self.image_paths)
  def __getitem__(self, idx):    # Read image    image = cv2.imread(self.image_paths[idx])
    # Get mask    mask = process_mask(self.image_paths[idx], self.xml_paths[idx])    mask = mask.squeeze()    mask = Image.fromarray(mask.astype("uint8"), "L")
    # Return preprocessed inputs    inputs = preprocessor(image, mask, ignore_index=None, return_tensors="pt")    inputs["pixel_values"] = inputs["pixel_values"].squeeze(0)    inputs["labels"] = inputs["labels"].squeeze(0)    return inputs

—THE END—

下载1：Pytorch常用函数手册

在「OpenCV与AI深度学习」公众号后台回复：Pytorch函数手册，即可下载学习全网第一份Pytorch函数常用手册，包括Tensors介绍、基础函数介绍、数据处理函数、优化函数、CUDA编程、多处理等十四章内容。

下载2：145个OpenCV实例应用代码

在「OpenCV与AI深度学习」公众号后台回复：OpenCV145，即可下载学习145个OpenCV实例应用代码（Python和C++双语言实现）。

欢迎加入CV学习交流微信群！

觉得有用，记得点个赞和在看

http://mp.weixin.qq.com/s?__biz=MzU5NDM1MjU5Mg==&mid=2247509442&idx=2&sn=b7fc592d8f4069fa22f8939d6c362dda

OpenCV与AI深度学习

专注计算机视觉、深度学习和人工智能领域干货、应用、行业资讯的分享交流！

最新文章

实战 | OpenCV两种不同方法实现粘连大米分割计数(步骤 + 代码)

如何使用 YOLOv11 分割对象

基于YoloV8的药丸/片剂类型识别

使用OpenCV检测并计算直线角度

基于深度学习的轮胎缺陷检测系统

一文带你了解X-Ray点料机原理与应用

245个目标检测开源项目合集，建议收藏！

使用OpenCV实现球跟踪和落点预测

使用YoloV8检测PCB元件

OpenCV4.8 GPU版本CMake编译详细步骤与CUDA代码演示

轻松入门数字图像处理，搞定OpenCV编程！【文末送书】

YOLOv11在自定义数据集上训练做实例分割

仅用CPU就能跑到1000FPS，这是开源的C++跨平台人脸检测项目

单目实现车辆测距的方法

工业缺陷检测中数据标注需要注意的几个事项

实战 | 粘连物体分割与计数应用--密集粘连药片分割+计数案例

涨点神器！100个即插即用缝合模块【合集下载】

OpenCV实战 | 低对比度缺陷检测应用实例--LCD屏幕脏污检测

顶会新方向！全新多模态大模型统一分割框架

实战 | 基于YOLOv9和OpenCV实现车辆跟踪计数（步骤 + 源码）

实战 | 基于YOLOv8和OpenCV实现车速检测(详细步骤 + 代码)

OpenCV无缝融合应用--指定目标颜色改变(附C++源码)

今年顶会这情况。。。大家还是提前做准备吧！

超越YOLOv10/11、RT-DETRv2/3！中科大D-FINE重新定义边界框回归任务

完爆YOLO家族？新一代目标检测器又有新突破！

改动一行代码，PyTorch训练三倍提速，这些「高级技术」是关键

最强总结，99个时间序列+时空数据的顶会创新！

Ubuntu24.04 安装 OpenCV4.10.0 和CUDA12.6

基于YoloV11自定义数据集实现车辆事故检测

OpenCV实现保险丝颜色识别（附源码）

我发现了水CV顶会的最强套路，真的不需要脑子

OpenCV快速傅里叶变换(FFT)用于图像和视频流的模糊检测

实战 | 使用姿态估计算法构建简单的健身训练辅助应用程序

计算机视觉开发者都应掌握的10个必备工具

70G 项目文件 100 帧稳定运行？NVIDIA RTX™ 5000 Ada 性能跑分远超上一代！

实战 | OpenCV中更稳更快的找圆方法--EdgeDrawing使用演示（详细步骤 + 代码）

实战 | 用Python和MediaPipe搭建一个嗜睡检测系统 (详细步骤 + 源码)

245个目标检测开源项目合集，建议收藏！

YOLOv8预测参数详解（全面详细、重点突出、大白话阐述小白也能看懂）

又一本开源免费的大模型书来了，449页pdf！

60行代码训练/微调 Segment Anything 2 (SAM 2)

视觉算法岗，Kaggle金牌和CCF A一作哪个更有用？

YOLOv11 C++ TensorRT项目使用

实战 | YOLO11自定义数据集训练实现缺陷检测 (标注+训练+预测保姆级教程)

Python和C++中使用并行计算增强图像处理能力

PaddleOCR 2.9 发布，正式开源文本图像智能分析利器

实战｜OpenCV实时弯道检测(详细步骤+源码)

基于Segformer实现PCB缺陷检测(步骤 + 代码)

导师抢一作已成潜规则？牛马哭了。。。

重磅：PyCharm成为OpenCV官方IDE

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉