超强!十大图像增强完全总结 !!

文摘   科技   2024-09-13 16:30   北京  

Hello,我是kk~ 

今天咱们来聊聊图像增强技术的一些事情,这里总结了10种图像增强技术的技术方法。

建议大家点赞收藏起来,慢慢学习~

图像增强技术旨在改善图像的质量和视觉效果,包括调整对比度、亮度、锐化边缘、去除噪声等手段,以增强图像的清晰度和信息量。这些技术广泛应用于计算机视觉、医学影像、摄影等领域,能够提升图像的可视化效果和信息表达能力,从而更好地满足用户需求和应用场景。

这里也为大家列举一些常见的关于图像增强技术的idea,帮助大家打开思路:

  • 基于深度学习的图像超分辨率增强方法

  • 多模态图像融合的增强方法

  • 图像对比度增强算法的优化

  • 基于深度学习的低光照图像增强

  • 自适应图像增强算法的研究

  • 基于稀疏编码的图像去噪增强方法

  • 图像超分辨率增强在医学影像中的应用

  • 多尺度图像增强方法的研究

  • 图像增强技术在遥感图像中的应用

  • 基于深度学习的图像色彩增强方法

  • 图像增强技术在视频处理中的应用

  • 基于物理模型的图像增强方法

  • 多模态医学图像融合的增强方法

  • 端到端的图像增强网络设计

  • 图像增强技术在智能交通监控中的应用


接下来,咱们来详细聊聊关于图像增强技术的细节理论点,最常见的包括:

1.直方图均衡化:调整图像的灰度级分布,增强图像的对比度。

2.对比度增强:增加图像的对比度,使图像中的亮度差异更加明显。

3.亮度调整:调整图像的亮度水平,使图像更明亮或更暗。

4.锐化:突出图像中的边缘和细节,增强图像的清晰度。

5.模糊:减少图像中的高频细节,使图像更加平滑。

6.噪声去除:使用滤波器等方法去除图像中的噪声,提高图像的质量。

7.边缘增强:突出图像中的边缘信息,使边缘更加清晰。

8.色彩增强:调整图像的色彩饱和度、色调等参数,增强图像的色彩效果。

9.多尺度增强:在不同尺度上对图像进行增强,以捕捉图像中不同层次的信息。

10.超分辨率:通过利用图像中的局部信息增强图像的分辨率,使图像更加清晰。

这些技术通常是在图像处理领域被广泛应用的基础技术,可以根据具体的图像处理任务选择合适的技术来进行图像增强。

在后续所有的代码中,均采用lenna图像,如果大家需要该图片。

后台回复“数据集”可获取~ 


直方图均衡化

图像增强是计算机视觉领域的一个重要主题,而直方图均衡化是其中一个常用的技术,用于增强图像的对比度。直方图均衡化的主要目标是使图像的灰度直方图变得均匀分布,从而增强图像的对比度,使细节更加突出。

原理

直方图均衡化的原理可以简要概括为以下几步:

  1. 计算直方图:首先计算图像的灰度直方图,即统计每个灰度级别的像素数量。

  2. 计算累积分布函数(CDF):将直方图归一化,并计算其累积分布函数。CDF表示了每个灰度级别在整个图像中出现的累积概率。

  3. 映射像素值:根据CDF,将原始图像中的每个像素的灰度值映射到新的灰度值,使得最终的灰度直方图均匀分布。

公式

直方图均衡化的公式如下:

其中, 表示灰度级别, 表示灰度级别  的像素数量, 表示总的像素数量。

示例代码

下面是一个简单的 Python 示例代码,演示如何实现直方图均衡化:

import cv2
import numpy as np

def histogram_equalization(image):
    # 计算直方图
    hist, bins = np.histogram(image.flatten(), 256, [0256])
    
    # 计算累积分布函数(CDF)
    cdf = hist.cumsum()
    cdf_normalized = cdf * hist.max() / cdf.max()
    
    # 使用线性插值计算新的像素值
    cdf_masked = np.ma.masked_equal(cdf, 0)
    cdf_masked = (cdf_masked - cdf_masked.min()) * 255 / (cdf_masked.max() - cdf_masked.min())
    cdf = np.ma.filled(cdf_masked, 0).astype('uint8')
    
    # 映射像素值
    equalized_image = cdf[image]
    
    return equalized_image

# 读取图像
image = cv2.imread('input_image.jpg'0)  # 以灰度模式读取图像

# 应用直方图均衡化
equalized_image = histogram_equalization(image)

# 显示原始图像和增强后的图像
cv2.imshow('Original Image', image)
cv2.imshow('Equalized Image', equalized_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

此代码将读取一张灰度图像,对其应用直方图均衡化,然后显示原始图像和增强后的图像。

通过学习以上示例代码和理解其原理,大家应该能够很容易地掌握直方图均衡化的基本概念和实现方法。

对比度增强

对比度增强是一种常用的图像增强技术,用于增强图像中的对比度,使图像更清晰、更易于分析。对比度增强的原理是通过调整图像的像素值,使得图像中的灰度差异更加明显。

原理

对比度增强的主要原理如下:

  1. 灰度拉伸(Contrast Stretching):通过线性拉伸图像的灰度范围,将原始图像中的灰度值映射到一个更广的范围内,使得灰度值之间的差异更加明显。

  2. 直方图均衡化(Histogram Equalization):在某些情况下,直方图均衡化也可以用于增强对比度。它通过重新分配图像的灰度级别,使得图像中的灰度值分布更加均匀,从而增强对比度。

公式

对比度增强的公式通常是针对每个像素进行调整,一种常见的方法是使用线性拉伸,其公式如下:

其中, 是原始图像中的像素值, 是增强后的像素值,   分别是原始图像中的最小和最大像素值。

示例代码

import cv2
import numpy as np

def contrast_enhancement(image):
    # 计算最小和最大像素值
    min_val = np.min(image)
    max_val = np.max(image)
    
    # 对每个像素进行线性拉伸
    enhanced_image = (image - min_val) * (255.0 / (max_val - min_val))
    
    # 将像素值限制在 0 到 255 之间
    enhanced_image = np.clip(enhanced_image, 0255).astype(np.uint8)
    
    return enhanced_image

# 读取图像
image = cv2.imread('lenna.jpg', cv2.IMREAD_GRAYSCALE)  # 以灰度模式读取图像

# 应用对比度增强
enhanced_image = contrast_enhancement(image)

# 显示原始图像和增强后的图像
cv2.imshow('Original Image', image)
cv2.imshow('Enhanced Image', enhanced_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

代码将读取一张灰度图像,对其应用对比度增强,然后显示原始图像和增强后的图像。

亮度调整

亮度调整是一种常见的图像增强技术,用于调整图像的亮度级别,使得图像在视觉上更加清晰或更加适合特定的应用场景。亮度调整通常可以分为加亮(增加亮度)和降暗(降低亮度)两种情况。

原理

亮度调整的主要原理是调整图像中每个像素的灰度值,以改变图像的整体亮度。具体来说:

  1. 加亮:增加图像中每个像素的灰度值,使整个图像变得更亮。

  2. 降暗:降低图像中每个像素的灰度值,使整个图像变得更暗。

公式

亮度调整的公式可以简单地表示为:

  1. 加亮

  2. 降暗

其中, 是原始图像中的像素值, 是调整后的像素值, 是加亮或降暗的幅度,可以是一个常数值或者根据具体需求动态计算。

示例代码

import cv2
import numpy as np

def adjust_brightness(image, delta):
    # 对每个像素进行亮度调整
    adjusted_image = np.clip(image.astype(np.int16) + delta, 0255).astype(np.uint8)
    return adjusted_image

# 读取图像
image = cv2.imread('input_image.jpg')  # 读取图像

# 设置亮度调整幅度
delta = 50  # 这里以加亮为例,若需要降暗可设置为负值

# 应用亮度调整
adjusted_image = adjust_brightness(image, delta)

# 显示原始图像和调整后的图像
cv2.imshow('Original Image', image)
cv2.imshow('Adjusted Image', adjusted_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

代码将读取一张图像,对其进行亮度调整,然后显示原始图像和调整后的图像。

通过学习以上示例代码和理解其原理,大家应该能够很容易地掌握亮度调整的基本概念和实现方法。

锐化

锐化是一种图像增强技术,旨在增强图像中的边缘和细节,使图像更加清晰和有视觉吸引力。锐化技术的主要原理是突出图像中的高频信息,通常通过增强边缘的对比度来实现。

原理

锐化的主要原理可以通过以下步骤来描述:

  1. 边缘检测:首先使用一种边缘检测算法(例如Sobel算子、Prewitt算子等)来检测图像中的边缘。

  2. 增强边缘:增强图像中检测到的边缘,通常通过增加边缘像素的灰度值来实现。这可以使边缘更加明显。

  3. 合并结果:将增强后的边缘与原始图像进行合并,以产生最终的锐化图像。

公式

一种常用的锐化算法是通过将原始图像与一个高通滤波器进行卷积来实现。一个简单的高通滤波器是拉普拉斯滤波器,其公式如下:

其中, 是原始图像中像素  的灰度值, 是使用拉普拉斯滤波器计算的像素 的值。

示例代码

下面是一个简单的 Python 示例代码,演示如何实现图像锐化:

import cv2
import numpy as np

def sharpen_image(image):
    # 定义拉普拉斯滤波器
    kernel = np.array([[0-10],
                       [-15-1],
                       [0-10]])
    
    # 对图像进行卷积操作
    sharpened_image = cv2.filter2D(image, -1, kernel)
    
    return sharpened_image

# 读取图像
image = cv2.imread('lenna.jpg')

# 将图像转换为灰度图像(可选)
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 应用图像锐化
sharpened_image = sharpen_image(gray_image)

# 显示原始图像和锐化后的图像
cv2.imshow('Original Image', gray_image)
cv2.imshow('Sharpened Image', sharpened_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

代码中,读取一张图像,对其进行锐化操作,然后显示原始图像和锐化后的图像。

模糊

图像模糊是一种常见的图像处理技术,也称为图像平滑或滤波。模糊操作旨在减少图像中的高频细节,从而使图像变得更加平滑或模糊。这在一些情况下是有用的,比如降低噪声、模糊敏感信息等。

原理

图像模糊的主要原理是使用滤波器(也称为卷积核)对图像进行卷积操作,从而减少图像中的高频分量。这种滤波器可以通过一些特定的数学运算来实现。常见的图像模糊方法包括均值模糊、高斯模糊、中值模糊等。

公式

  1. 均值模糊(平均模糊):用周围像素的平均值来代替中心像素的值,以此来减少图像中的高频噪声。

  2. 高斯模糊:对图像进行加权平均,权重由高斯函数确定,离中心像素越远的像素权重越小,因此达到了对图像的平滑处理。

  3. 中值模糊:将中心像素周围的像素值排序,并取中间值作为中心像素的值,因此能够有效地去除噪声。

示例代码

下面是一个简单的 Python 示例代码,演示如何实现图像模糊(以高斯模糊为例):

import cv2

def blur_image(image):
    # 使用高斯滤波器进行模糊处理
    blurred_image = cv2.GaussianBlur(image, (55), 0)
    return blurred_image

# 读取图像
image = cv2.imread('lenna.jpg')

# 应用图像模糊
blurred_image = blur_image(image)

# 显示原始图像和模糊后的图像
cv2.imshow('Original Image', image)
cv2.imshow('Blurred Image', blurred_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

代码将读取一张图像,对其进行高斯模糊操作,然后显示原始图像和模糊后的图像。

噪声去除

噪声去除是一种常见的图像增强技术,旨在消除图像中的噪声,从而改善图像质量和提高后续处理的准确性。噪声可以由多种因素引起,例如传感器噪声、信号传输中的干扰等。噪声去除技术的目标是尽可能地保留图像中的有用信息,同时尽量减少噪声的影响。

原理

噪声去除的主要原理是利用图像的局部统计信息来对每个像素进行修复或滤波。常用的噪声去除方法包括均值滤波、中值滤波、高斯滤波、非局部均值滤波等。这些方法基于不同的假设和算法来对图像进行平滑处理,从而消除噪声。

公式

  1. 均值滤波:用像素周围的邻域像素的平均值来代替中心像素的值,公式如下:

其中, 是平滑后的像素值, 是原始图像中邻域像素的值, 是邻域像素的数量。

  1. 中值滤波:将中心像素周围的像素值排序,并取中间值作为中心像素的值,公式如下:

其中, 是平滑后的像素值, 表示中值操作, 是原始图像中邻域像素的值。

示例代码

代码演示如何实现图像的噪声去除(以中值滤波为例):

import cv2

def denoise_image(image):
    # 使用中值滤波进行噪声去除
    denoised_image = cv2.medianBlur(image, 5)
    return denoised_image

# 读取图像
image = cv2.imread('lenna.jpg')

# 将图像转换为灰度图像(可选)
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# 应用噪声去除
denoised_image = denoise_image(gray_image)

# 显示原始图像和去噪后的图像
cv2.imshow('Original Image', gray_image)
cv2.imshow('Denoised Image', denoised_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

此代码将读取一张灰度图像,对其进行中值滤波噪声去除操作,然后显示原始图像和去噪后的图像。

边缘增强

边缘增强是一种常见的图像增强技术,旨在增强图像中的边缘信息,使图像中的边缘更加清晰和突出。边缘增强技术通常会突出图像中灰度变化较大的区域,以便更好地识别和分析图像中的目标。

原理

边缘增强的主要原理是通过增加图像中像素值的梯度来增强边缘信息。梯度表示的是图像中灰度变化的速率,因此增强梯度值可以使得图像中的边缘更加清晰。常见的边缘增强方法包括梯度算子、Sobel算子、Prewitt算子等。

公式

边缘增强的公式可以通过梯度算子来实现,其中Sobel算子是一种常用的梯度算子。Sobel算子在水平和垂直方向上分别使用一对3x3的卷积核来计算图像的梯度,然后通过平方求和再开方得到梯度幅值。其公式如下:

其中, 是梯度幅值,   分别是图像在水平和垂直方向上的梯度。

示例代码

以下代码如何使用Sobel算子实现图像的边缘增强:

import cv2
import numpy as np

def edge_enhancement(image):
    # 使用Sobel算子计算梯度
    sobelx = cv2.Sobel(image, cv2.CV_64F, 10, ksize=3)
    sobely = cv2.Sobel(image, cv2.CV_64F, 01, ksize=3)
    
    # 计算梯度幅值
    gradient_magnitude = np.sqrt(sobelx**2 + sobely**2)
    
    # 将梯度幅值限制在0到255之间
    gradient_magnitude = np.clip(gradient_magnitude, 0255).astype(np.uint8)
    
    return gradient_magnitude

# 读取图像
image = cv2.imread('lenna.jpg', cv2.IMREAD_GRAYSCALE)  # 以灰度模式读取图像

# 应用边缘增强
enhanced_image = edge_enhancement(image)

# 显示原始图像和增强后的图像
cv2.imshow('Original Image', image)
cv2.imshow('Enhanced Image', enhanced_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

此代码将读取一张灰度图像,使用Sobel算子计算图像的梯度,并将梯度幅值作为边缘增强后的图像进行显示。

色彩增强

色彩增强是一种常见的图像增强技术,旨在调整图像的色彩和色调,使图像看起来更加鲜艳、生动或更适合特定的应用场景。色彩增强技术通常涉及调整图像的色相、饱和度和亮度等参数。

原理

色彩增强的主要原理是通过调整图像中像素的色彩值,使图像在视觉上更加吸引人或更适合特定的需求。常见的色彩增强方法包括色相饱和度(Hue-Saturation)调整、直方图均衡化、色彩平衡等。

公式

  1. 色相饱和度调整:色相(Hue)是指颜色在色轮中的位置,饱和度(Saturation)是指颜色的纯度或鲜艳程度。色相饱和度调整的公式可以使用不同的数学模型来实现,常见的是基于HSV(色相、饱和度、亮度)颜色空间的调整方法。

  2. 直方图均衡化:通过重新分配图像的灰度级别,使得图像中的颜色分布更加均匀,从而增强图像的色彩饱和度和对比度。

示例代码

代码演示如何实现图像的色彩增强(以HSV颜色空间为例):

import cv2
import numpy as np

def color_enhancement(image, hue_shift=0, saturation_scale=1.0, value_scale=1.0):
    # 将图像转换为HSV颜色空间
    hsv_image = cv2.cvtColor(image, cv2.COLOR_BGR2HSV)
    
    # 调整色相
    hsv_image[:, :, 0] = (hsv_image[:, :, 0] + hue_shift) % 180
    
    # 调整饱和度和亮度
    hsv_image[:, :, 1] = np.clip(hsv_image[:, :, 1] * saturation_scale, 0255)
    hsv_image[:, :, 2] = np.clip(hsv_image[:, :, 2] * value_scale, 0255)
    
    # 将图像转换回BGR颜色空间
    enhanced_image = cv2.cvtColor(hsv_image, cv2.COLOR_HSV2BGR)
    
    return enhanced_image

# 读取图像
image = cv2.imread('lenna.jpg')

# 应用色彩增强
enhanced_image = color_enhancement(image, hue_shift=20, saturation_scale=1.2, value_scale=1.1)

# 显示原始图像和增强后的图像
cv2.imshow('Original Image', image)
cv2.imshow('Enhanced Image', enhanced_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

请此代码将读取一张图像,对其进行色彩增强操作,并显示原始图像和增强后的图像。

多尺度增强

多尺度增强是一种图像增强技术,旨在通过在不同尺度上对图像进行增强来提高图像的质量和表现。多尺度增强技术通常涉及使用不同尺度的滤波器或处理方法来处理图像,并将结果合并以获得最终增强的图像。

原理

多尺度增强的主要原理是利用图像在不同尺度上的特征来增强图像。由于图像中的特征可以在不同尺度上表现出不同的细节和结构,因此通过在不同尺度上对图像进行处理,可以更全面地捕获图像的特征并提高图像的质量。

公式

多尺度增强通常涉及使用不同的滤波器或处理方法在不同尺度上对图像进行处理,然后将处理后的图像进行合并以获得最终的增强效果。具体的公式取决于所使用的增强方法和滤波器。

示例代码

代码演示如何实现多尺度增强(以高斯金字塔为例):

import cv2

def multi_scale_enhancement(image):
    # 构建高斯金字塔
    gaussian_pyramid = [image]
    for i in range(3):
        image = cv2.pyrDown(image)
        gaussian_pyramid.append(image)
    
    # 对每个尺度上的图像进行增强处理
    enhanced_pyramid = []
    for scale_image in gaussian_pyramid:
        # 在此示例中,简单地进行高斯模糊操作作为增强处理
        enhanced_image = cv2.GaussianBlur(scale_image, (55), 0)
        enhanced_pyramid.append(enhanced_image)
    
    # 重建增强后的图像
    reconstructed_image = enhanced_pyramid[-1]
    for i in range(2-1-1):
        reconstructed_image = cv2.pyrUp(reconstructed_image)
        reconstructed_image = cv2.add(reconstructed_image[:enhanced_pyramid[i].shape[0], :enhanced_pyramid[i].shape[1]], enhanced_pyramid[i])
    
    return reconstructed_image

# 读取图像
image = cv2.imread('lenna.jpg')

# 应用多尺度增强
enhanced_image = multi_scale_enhancement(image)

# 显示原始图像和增强后的图像
cv2.imshow('Original Image', image)
cv2.imshow('Enhanced Image', enhanced_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

此代码将读取一张图像,使用高斯金字塔对图像进行多尺度分解和重建,并在每个尺度上对图像进行增强处理,最后合并重建得到增强后的图像。

超分辨率

超分辨率是一种图像增强技术,旨在从低分辨率图像中恢复出高分辨率图像。这项技术在图像处理、计算机视觉和机器学习领域中都有重要应用,特别是在图像增强、图像重建和图像超分辨率重建方面。

原理

超分辨率的主要原理是通过从低分辨率图像中推测和恢复出高分辨率图像的细节和结构。通常情况下,这需要使用一些先进的算法和模型来实现,例如基于深度学习的超分辨率网络。

公式

超分辨率的公式通常涉及使用机器学习模型或者复杂的数学算法进行图像的重建和增强,因此不太容易通过简单的公式来描述。基于深度学习的超分辨率方法通常会使用卷积神经网络(CNN)来学习低分辨率图像与高分辨率图像之间的映射关系,然后利用学到的映射关系来对新的低分辨率图像进行预测,从而生成高分辨率图像。

示例代码

由于超分辨率是一个非常复杂的技术,并且通常需要大量的训练数据和计算资源来实现,因此在这里提供一个简单的示例代码,演示如何使用OpenCV的图像金字塔来实现简单的超分辨率效果:

import cv2

# 读取低分辨率图像
low_resolution_image = cv2.imread('lenna.jpg')

# 使用金字塔上采样来增强分辨率
upgraded_image = cv2.pyrUp(low_resolution_image)

# 显示低分辨率图像和增强后的图像
cv2.imshow('Low Resolution Image', low_resolution_image)
cv2.imshow('Upgraded Image', upgraded_image)
cv2.waitKey(0)
cv2.destroyAllWindows()

这个简单的示例代码使用了OpenCV的图像金字塔来进行简单的上采样,以增强低分辨率图像的分辨率。

需要注意的是,这个示例只是为了演示超分辨率的概念,并不能真正地实现从低分辨率图像中恢复出高分辨率图像的效果。真正的超分辨率方法通常需要更加复杂的算法和模型来实现,例如基于深度学习的超分辨率网络。

最后

添加微信:kkcoder,备注:CV、NLP,拉你入群,一起学习。

好了,今天的内容先这样,继续想看解决什么问题,评论区留言~

都到这里了,记得点赞哦~

kk机器学习算法
机器学习基础、计算机视觉…
 最新文章