研究团队
李馨月,段慧煜,王嘉,刘笑宏,陈一彤,翟广涛:上海交通大学
文章下载
Li X Y, Duan H Y, Wang J, et al. Situation-adaptive neural network for fast pre-computing image enhancement. Sci China Inf Sci, 2025, 68(2): 124101随着智能视觉任务的广泛应用,图像在进行进一步计算分析之前的增强变得至关重要。然而,现有的图像增强技术往往需要大量计算资源,并且在不同场景下适应性薄弱,常常需要重新训练,增加了实际应用的复杂性。特别是在光计算这样的创新计算架构中,由于缺乏足够的先验信息,传统技术很难提供稳定且一致的增强效果。本文提出的情况自适应查找表方法,适用于光计算系统产生的图像,能够在低光照条件下模拟不同情景偏好,灵活调整图像的色彩和质量。文章提出了SAEnhancer,一种情境自适应的光电计算预处理神经网络,旨在实现快速预计算图像增强。该方法能够通过少量样本进行学习,无需重新训练,从而实现个性化和灵活的图像增强。下图(a)为SAEnhancer的具体结构,图(b)为SAEnhancer在面对不可见新场景时的学习及推理流程。创新主要体现在以下几个方面:
(1) 不可见情境下的自适应图像增强:该方法能够基于极少量样本集进行学习,实现个性化图像增强,无需重新训练,便可有效应用于未见数据和情境。
(2) 语义感知的颜色调整:引入了语义感知颜色调整模块,以实现更为精细的图像颜色调节,相较于传统三维查找表 (LUT) 方法具有显著优势。
(3) 多场景风格增强:该方法具备根据不同光照条件及设备需求灵活处理各类情境的能力,尤其在光学计算等设备中展现出良好的适应性,从而实现更具上下文感知性的调整。这一工作在广受认可的MIT-Adobe FiveK数据集上进行了全面而系统的实验验证,聚焦于单场景与多场景下的图像增强任务。实验数据展示了SAEnhancer在主观视觉体验与客观量化评估(如峰值信噪比PSNR、结构相似性指数SSIM)上均优于当前主流方法。SAEnhancer在单场景图像增强任务中实现了PSNR 25.51和SSIM 0.926,证明其能有效保留图像细节和结构一致性。在多场景任务中,SAEnhancer同样展现了灵活性与适应性,PSNR达到24.50,SSIM为0.914,进一步验证了其跨场景应用的潜力。 值得一提的是,本文还探索了SAEnhancer在面对全新、未经训练场景时的快速学习与适应能力。实验结果显示,即便是仅提供5至10对样本这种极端条件下,SAEnhancer也能快速捕捉并学习新场景的色彩特征,生成符合特定场景的增强图像。这一发现不仅彰显了SAEnhancer的泛化能力,也为光电计算领域的预处理技术提供了新的可能性。