基于拉普拉斯金字塔实现图像融合（步骤 + 代码）

2024-10-14 08:30 重庆

点击下方卡片，关注“机器视觉与AI深度学习”

视觉/图像重磅干货，第一时间送达!

假设您想要混合两幅图像：一幅是苹果，一幅是橘子。

如果您想要将两张图像混合成半个苹果、半个橙子的图像，那么您可以取苹果的左半部分并将其与橙子的右半部分并排组合在一起。

但是这张图片看起来很糟糕。它看起来非常不自然，而且水果中间的分界线非常显眼。我们想要的是一张更像这样的图片。

注意苹果和橙子融合的平滑过渡。虽然这看起来仍然不真实，但这当然是我们比未融合图像更喜欢的。拉普拉斯金字塔图像融合将允许我们做到这一点：

拉普拉斯金字塔图像混合并不局限于图像中间部分的混合。它可以帮助混合轮廓，并以各种方式合并图像。

具体实现原理：

拉普拉斯金字塔结构如下，看上去很复杂，其实很简单。

拉普拉斯金字塔建立在高斯金字塔的基础上。高斯金字塔用于表示不同比例下的信息（在本例中为图像），每个比例下原始图像的信息都得以保留。简而言之，高斯金字塔是一系列图像，从原始图像开始，原始图像缩小 1/2，原始图像缩小 1/4，依此类推。在金字塔的每次转换中，我们都希望将图像缩小 1/2。

为了将图像比例缩小 1/2，高斯金字塔将平滑与下采样相结合。首先，使用高斯滤波器对图像进行平滑处理，然后下采样 1/2。要下采样 1/2，只需在每行和每列中每隔一个像素取一个即可。

你可能会问自己，为什么不直接将采样率降低 1/2，并跳过平滑步骤呢？这仍然会导致图像缩小 1/2。然而，问题在于混叠。

当通过跳过像素进行下采样时，可能会丢失图像中的重要信息。具体来说，根据您下采样的粒度，您可能会丢失所有对比度区域。以下图为例。在棋盘 A 和 B 中，下采样发生的频率足够高，因此图案得以保留。然而，在棋盘 C 中，下采样的频率变得太低，采样图像全黑。在棋盘 D 中，下采样图像根本不能代表原始棋盘图案。

平滑可降低图像特征的最大频率，并减少仅使用子采样会遗漏的强烈对比和快速变化。通过将图像与高斯滤波器进行卷积来对图像进行高斯平滑本质上是对图像执行低通滤波。对图像进行低通滤波的目的是保留图像中的低频信息（例如低对比度位置），同时减少高频信息（例如边缘）。平滑会去除边缘！

为了执行卷积，我们在每个像素上应用此卷积运算，并根据需要使用镜像或零填充。

使用高斯金字塔，在每个尺度上，图像尺寸减小 2 倍，而所应用的聚合高斯平滑滤波器的尺度增加 2 倍。简单地说，金字塔的每一层，图像都会变得更小、更模糊。

接下来，我们构建拉普拉斯金字塔。为了在给定级别 i 构建拉普拉斯，我们首先从高斯金字塔中对下一个最小级别的缩小图像进行上采样。我们从当前级别的高斯金字塔中的图像中减去上采样的图像。

为了对较小的图像进行上采样，我们使用插值进行上采样，即先上采样再进行滤波。以 2 倍的倍数进行上采样会在原始图像的每个像素之间插入 1 个零。然后我们使用高斯滤波器对该图像进行低通滤波，以消除上采样插入的图像伪影和异常。然后，我们从高斯金字塔中当前比例的图像中减去上采样后的图像（蓝色框）。这些图像在上采样后将具有相同的大小，结果就是当前比例的拉普拉斯算子。

拉普拉斯算子本质上是一个高通滤波器。它只捕捉图像的细节和边缘。直观地，我们可以想象，从有细节的图像中减去没有细节的平滑图像，将只留下细节。

我们继续讨论拉普拉斯金字塔的其余部分。

对于苹果和橙子这两幅输入图像，我们必须构建一个拉普拉斯金字塔。然后，我们为蒙版构建一个高斯金字塔。

将高斯滤波器应用于子采样蒙版可使图像混合变得平滑。蒙版有助于我们将两个输入的拉普拉斯金字塔组合起来。使用 alpha+(1-alpha) 组合，在每个尺度上，我们将蒙版乘以图像 A 的拉普拉斯，然后将图像 B 的拉普拉斯乘以 (1-mask) 并将两者相加。

最后，我们将组合拉普拉斯算子添加到原始高斯调整大小图像中，并乘以各自的掩码，从而重建每个比例的原始图像。这类似于将调整大小时丢失的细节（组合拉普拉斯算子）添加回高斯平滑图像中，并根据所需形式（掩码）进行组合。我们重复执行此操作，对结果进行上采样，并将结果添加到组合拉普拉斯算子中，直到我们在原始比例下获得完全混合的图像。

这里我们有这个图像混合的完整算法：

为了直观地展示该算法的作用，最终的拉普拉斯金字塔如下所示：

代码链接：

https://github.com/mzhao98/laplacian_blend/blob/master/ImageBlending.ipynb

视频教程：

https://www.bilibili.com/video/BV1qF2hYTEcu/?vd_source=694affe020ffc5ded6a1bf88970fca8f

—THE END—

觉得有用，麻烦给个赞和在看

http://mp.weixin.qq.com/s?__biz=MzU4ODM4NjcyMg==&mid=2247494628&idx=2&sn=a0e7ae67d0b41602a90f6fac9bd6b9a4

机器视觉与AI深度学习

专注于机器视觉、AI、深度学习等技术最新资讯、实战内容及应用案例的分享，交流！

最新文章

YOLOv11在自定义数据集上训练做实例分割

Halcon和Opencv 的区别

基于YoloV8的药丸/片剂类型识别

使用OpenCV进行球跟踪和落点预测

深度学习“三板斧” ，螺丝检测“快准狠”

基于深度学习模型融合的工业产品（零部件）工艺缺陷检测算法简述

基于深度学习的轮胎缺陷检测系统

双目相机深度检测

实战 | 基于YOLOv8的车辆跟踪与车速计算应用（步骤 + 源码）

机器视觉在苹果中的应用

大型视觉语言模型OMG-LLaVA：图像级、目标级和像素级的推理和理解任务统一

如何解决工业缺陷检测小样本问题？

机器视觉应用案列-半导体芯片检测

超越YOLOv10/11、RT-DETRv2/3！中科大D-FINE重新定义边界框回归任务

一文带你了解X-Ray点料机原理与应用

在win11上跑yolo目标检测算法全流程

实战 | OpenCV中更稳更快的找圆方法--EdgeDrawing使用演示（详细步骤 + 代码）

Ubuntu24.04 安装 OpenCV4.10.0 和CUDA12.6

基于机器视觉的外观瑕疵缺陷检测系统

干货 | 鱼眼镜头模型和校正方法详解

实战 | 使用姿态估计算法构建简单的健身训练辅助应用程序

干货 | 双目相机标定与图像深度估计

基于YoloV11自定义数据集实现车辆事故检测

基于Segformer实现PCB缺陷检测(步骤 + 代码)

完爆YOLO家族？新一代目标检测器又有新突破！

计算机视觉开发者都应掌握的10个必备工具

YOLOv11 C++ TensorRT项目使用

使用OpenCV实现摄像头测距

PaddleOCR 2.9 发布，正式开源文本图像智能分析利器

Python和C++中使用并行计算增强图像处理能力

使用树莓派4 + Coral USB加速器实现姿态检测

基于zbar的二维码识别

实战 | YOLO11自定义数据集训练实现缺陷检测 (标注+训练+预测保姆级教程)

YOLOv8预测参数详解（全面详细、重点突出、大白话阐述小白也能看懂）

TPAMI | SegNet:语义分割领域超经典轻量化模型

海康威视前端摄像头镜头基础知识，值得收藏学习！

实战 | 使用YOLOv8图像分割实现路面坑洞检测（步骤 + 代码）

干货 | OpenCV库处理视频文件，并对照片进行三维建模

T-Rex Label ！超震撼 AI 自动标注工具，开箱即用、检测一切

基于机器视觉的泡罩药板缺陷检测方案

基于YOLOv8的关键点检测的仪表盘读数方案详解

一文看懂工业视觉与计算机视觉的区别

YOLO11介绍及五大任务推理演示(目标检测，图像分割，图像分类，姿态检测，带方向目标检测)

基于拉普拉斯金字塔实现图像融合（步骤 + 代码）

使用PyTorch进行小样本学习的图像分类

可解释性AI：GradCAM介绍

基于3D机器视觉的大圆柱电池测量方案

基于OpenCV实现模糊检测 / 自动对焦

工业相机标定相关知识整理（内参、外参、畸变参数......）

如何看待今年比亚迪秋招只要双2以上的？

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉