首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

图像分割：超像素(Superpixel)分割的大致原理

文摘 2024-11-03 23:25 江苏

一、背景

首先一张图片由一个个像素组成（可以看成网格），每个像素可以有一个灰度值（标量）或RGB值（三维向量）。

http://a-chien.blogspot.de/2017/01/excel-vba_5.html

现今一张图片动辄1000*1000=100w像素，因此对于图像处理来说，是非常大的维度。

超像素最大的功能之一，便是作为图像处理其他算法的预处理，在不牺牲太大精确度的情况下降维！

二、超像素

超像素最直观的解释，便是把一些具有相似特性的像素“聚合”起来，形成一个更具有代表性的大“元素”。

而这个新的元素，将作为其他图像处理算法的基本单位。

一来大大降低了维度；二来可以剔除一些异常像素点。

至于根据什么特性把一个个像素点聚集起来，可以是颜色、纹理、类别等。

看下图大家就能一瞥一二：

https://ivrl.epfl.ch/research/superpixels

三、超像素算法

理论上，任何图像分割算法的过度分割(over-segmentation)，即可生成超像素。

下面是一个图像分割算法的例子（举此例还因为这里分割标准是依据纹理）。

https://github.com/mstorath/Pottslab

四、超像素算法判别条件

市面上如此多的超像素算法，如何比较他们的优劣呢？

一般业内参考以下三个指标（具体公式请参考【1】）.

(1) Undersegmentation Error

下图，白色是原图的一个物体，红线是一个个超像素的轮廓，而粉红色的区域就是undersegmentation的区域。显然，这部分区域越大就越不好。

(2) Boundary Recall

下图，黑色虚线以及实现是原图物体的轮廓，红线是超像素的边界。一个好的超像素算法，应该覆盖原图物体的轮廓。在给予一定缓冲（粉红色区域）的情况下，超像素的边缘可以覆盖原图物体边缘的越多（黑色实线），该算法就越好。

(3) Compactness score

这个指标衡量了一个超像素是否“紧实”。

下图，高下立判。

https://ivrl.epfl.ch/research/superpixels

五、超像素算法举例

(1) 种子像素初始化

SLIC利用了简单的聚类（贪婪）算法，初始时刻，每一个聚类的中心被平均地分布在原图中。而超像素的个数，也可以基本由这些中心点来决定。

每一步迭代，种子像素合并周围的像素，形成超像素。

(2) 矩形区域初始化

SEEDS的初始化，是把原图先平均分割成很多矩形，初始超像素即为这些矩形。每一步迭代，超像素的边缘不断变化，直到converge.

【参考资料】：

【1】D Stutz etl，Superpixels: an evaluation of the state-of-the-art，Computer Vision and Image Understanding 166, 1-27

该文作者是德国亚琛工大计算机本科，马普所计算机博士生，对比了几乎所有有开源代码的超像素算法。作者还把论文中evaluate指标的算法开源了，参考：davidstutz/superpixels-revisited

来源：阿柴的算法学习日记

本文仅做学术分享，如有侵权，请联系删文。

http://mp.weixin.qq.com/s?__biz=MzAxNTc4MTc1Ng==&mid=2649471920&idx=1&sn=5838e745e5e44b39523719176907336c

新机器视觉

一个值得关注的AI视觉技术公众号，主要涉及人工智能领域机器视觉、计算机视觉、机器学习、深度学习等前沿知识干货和资源！致力于为您提供切实可行的AI学习线路。

最新文章

万字长文，搞懂 AI 大模型的技术原理！

什么是传感器 MTF？

从科幻到现实：简单更换镜头将普通相机变身高光谱设备

什么是机器学习？通过机器学习方法能解决哪些问题？

今天面试了一个字节女生，当场想给她 offer！

机器视觉常用的三种目标识别方法解析

一种深度学习方法---迁移学习了解下

注意力引导的标志检测与识别

2024年图像匹配挑战赛：银牌解决方案！

使用 YOLO 加速实时应用程序中的对象检测 !

常见的图像处理技术

一学术达人 TikZ 学术绘图库 - 机器学习方法图好全好看，速来！

显微镜分辨率与相机分辨率

【深度学习】PyTorch训练一个CNN分类器

机器学习 | LangChain框架快速入门

基于迁移学习的车辆目标识别

图像配准的前世今生：从人工设计特征到深度学习

不谈高级原理，只用简单的语言来聊聊机器学习

10分钟了解AI开发的基本过程

OCR文字识别原理及应用

Halcon和Opencv 的区别

高光谱图像数据？——What & How

计算机视觉、计算机图形学和数字图像处理三者的区别与联系。

一种新型光学快速自动聚焦系统

机器学习 | 强化学习如何让机器自主决策并优化行为

YOLO 11 安装与使用指南

一文了解 | 物方远心、像方远心及双远心镜头的特点、区别及其应用场景

一种轻量级深度学习模型，在IoT设备上的实时行人检测！

Nature打破质疑！视觉成像发展的“新风口”！全新技术将颠覆传统研究！

计算机视觉中的传统特征提取方法总结

入门 | 研究自动驾驶技术的算法需要哪些知识？

定位算法—MCL蒙特卡洛滤波

第一次接触FPGA至今，总结的宝贵经验~

速刷人工智能算法 | 基本遗传算法

基于MIMU与Wi-Fi的普适室内定位方法综述

多传感器时空标定

一文带你了解机器人是如何通过视觉实现目标跟踪的！

一文详解基于先验地图的视觉定位

图像分割：超像素(Superpixel)分割的大致原理

工业相机中的工作模式设定的使用方法

深入浅出Batch Size，对模型训练的影响分析

一文看完多模态：从视觉表征到多模态大模型

DINOv2！计算机视觉领域的基础模型终于出现

YOLO 系列目标检测大合集

行人搜索算法综述

用python写一个图像文字识别OCR工具

视觉基础之相机标定

机器学习和深度学习的区别到底是什么?

实操教程｜怎样制作目标检测的训练样本图像？

3D 激光雷达 SLAM 算法综述

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉