北大开源全新图像压缩感知网络：参数量、推理时间大幅节省，性能显著提升 | 顶刊TPAMI

科技 2024-12-17 12:47 北京

新智元报道

编辑：LRST

【新智元导读】PCNet网络具有创新的协同采样算子和优化的重建网络，实验结果证明，其在图像重建精度、计算效率和任务扩展性方面均优于现有方法，为高分辨率图像的压缩感知提供了新的解决方案。

压缩感知（Compressed Sensing，CS）是一种信号降采样技术，可大幅节省图像获取成本，其核心思想是「无需完整记录图像信息，通过计算即可还原目标图像」。

CS的典型应用包括：

降低相机成本：利用廉价设备就能拍摄出高质量图像；
加速医疗成像：将核磁共振成像（MRI）时间从40分钟缩短至10分钟内，减少被检查者的不适；
探索未知世界，助力科学研究：将「看不见」的事物变为「看得见」，如观测细胞活动等转瞬即逝的微观现象，以及通过分布式射电望远镜观测银河系中心的黑洞。

CS的两个核心问题是：

如何设计采样矩阵，从而尽可能多地保留图像信息？
如何设计高效的重建算法，从而精准复原图像内容？

CS的数学模型可表示为，其中x是原始图像，A是采样矩阵，y是压缩观测值。

现有CS方法主要存在两个局限性：

采样矩阵信息保留能力不足：将图像切块，逐块采样，导致观测值信息量有限；
重建算法的计算开销过大、复原精度有限。

针对现有的问题，北京大学信息工程学院的研究人员提出了一种实用、紧致的图像压缩感知网络PCNet，其针对压缩感知（Compressed Sensing, CS）领域长期存在的关键难题，设计了一种全新的协同采样算子，提高了模型在任意采样率下的灵活性、可解释性和恢复性能。

论文链接：https://ieeexplore.ieee.org/document/10763443

代码链接：https://arxiv.org/abs/2411.13081

发表刊物：IEEE Transactions on Pattern Analysis and Machine Intelligence (TPAMI)

PCNet

1. 新型压缩采样矩阵设计

现有的压缩采样矩阵设计方法在信息保留能力上存在局限性，难以同时捕获图像的局部与全局特征。PCNet 针对此问题，提出了一种新型的协同压缩采样矩阵，显著提高了采样过程中的信息保留能力。该设计通过以下两步实现：

（1）局部特征提取：通过一个轻量级的小型卷积网络对输入图像进行滤波，充分捕捉图像的局部细节特征，例如边缘和纹理。这一过程有效降低了数据的冗余性，同时为后续全局特征融合奠定了基础。

（2）全局降维与特征融合：在完成局部特征提取后，进一步使用一个全局矩阵对滤波结果进行降维操作。全局矩阵通过引入更大的感受野，将图像的全局信息（如大尺度结构和整体布局）与局部特征有机结合，从而生成具有丰富信息的压缩观测值。

这种两阶段的采样方法，不仅确保了对细节特征的捕捉，还弥补了传统切块式采样方法在全局信息保留上的不足，使得生成的压缩观测值信息量更大、利用效率更高。

2. 新型图像重建网络设计

为了实现从压缩观测值到高质量图像的精准重建，本研究设计了一种融合优化理论与深度学习的图像重建网络。该网络在以下几个方面进行了创新性改进：

（1）基于近端梯度下降（Proximal Gradient Descent, PGD）的深度展开结构

传统 PGD 算法在求解稀疏优化问题时具有较强的理论保证，但其迭代过程较为缓慢，且难以适应复杂的图像数据。PCNet 将 PGD 算法的每一次迭代操作转化为深度神经网络中的一个层，通过这种深度展开策略，使得网络兼具理论可解释性和实际效率。

（2）模块化设计提升重建精度

在深度展开网络中，结合了最新的模块设计，包括注意力机制（Attention Mechanism）和多尺度特征融合模块，进一步提升了重建效果：

注意力机制：通过引入通道注意力和空间注意力，有效增强了网络对重要图像区域（如边缘和纹理）的关注能力。
多尺度特征融合：在不同尺度上提取和整合特征，确保网络既能恢复局部细节，也能重建全局结构。

（3）轻量化与高效性

为了适应高分辨率图像（如2K、4K、8K）的处理需求，PCNet 在设计中采用了参数量和计算开销较低的网络架构，同时通过优化内存使用和并行计算能力，大幅提高了推理效率。

3. 应用范围的扩展性与通用性

除了在标准压缩感知任务中的表现，PCNet 的设计还具备较强的扩展性，其核心思想可以直接应用于以下任务中：

（1）量化压缩感知（Quantized CS）

利用所提出的协同压缩采样矩阵，应对观测值受量化误差影响的场景，实现高效的量化数据还原。

（2）自监督压缩感知（Self-Supervised CS）

将采样矩阵与重建网络设计融入自监督学习框架，降低对真值数据的依赖，同时提升算法的通用性和鲁棒性。

PCNet 的这些创新设计显著解决了现有方法在采样和重建方面的性能瓶颈，为压缩感知技术的实际应用提供了全新的可能性。

图1 提出的实用、紧致的压缩感知网络PCNet。

图2 提出的协同采样算子。

实验结果

为了验证所提出方法 PCNet 的有效性与优势，本工作在多个基准数据集和多种任务场景下进行了详尽的实验评估，如图3所示。这些评估涵盖了压缩感知性能、算法效率和通用性测试。以下是实验结果的详细描述：

1. 图像重建精度

PCNet 在多个公开的图像基准数据集（Set11、CBSD68、Urban100、DIV2K）上进行了系统实验，并与当前主流的压缩感知方法进行了对比，重点评估了重建图像的峰值信噪比（PSNR）和结构相似性（SSIM）。

结果表明，在Set11数据集上，PCNet在PSNR和SSIM上均超越现有方法，特别是在低采样率条件下，能够重建出更高质量、细节更清晰的图像；在CBSD68数据集的自然图像测试集中，PCNet展现出卓越的细节保留能力，尤其在边缘和纹理区域，其性能显著优于传统方法；

在Urban100数据集的城市场景中，PCNet 在高频细节（如建筑物的边缘线条和窗户结构）上实现了更高的清晰度和精确度；在 DIV2K 数据集上，面对高分辨率（2K、4K、8K）图像的挑战，PCNet 在不同采样率下均取得显著性能提升，充分展示了其对高分辨率场景的适应能力。

2. 计算效率与资源消耗

实验还评估了PCNet在计算效率和资源消耗方面的性能，结果表明，在相同硬件条件下，PCNet的推理时间平均比传统方法减少了40%，充分证明了其轻量化设计的优越性；在内存使用方面，PCNet的优化设计显著降低了高分辨率重建任务的内存占用，使其能够在有限资源的设备上高效运行；在参数量方面，与复杂的深度学习方法相比，PCNet的参数量减少了30%以上，但性能却显著提升。

3. 任务扩展性与通用性测试

除了在标准压缩感知任务中的卓越表现外，PCNet的实验还验证了其在其他相关任务中的适用性。在量化压缩感知任务中，PCNet的协同采样矩阵设计能够有效适应量化误差，即使在量化误差较大的情况下，重建性能仍优于现有方法；在自监督学习任务中，PCNet在无标注数据的场景下结合自监督框架进行训练，展现了出色的适应能力和鲁棒性。

图3 方法与其他CS方法的对比结果。

参考资料：

https://ieeexplore.ieee.org/document/10763443

新智元

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

最新文章

27亿刀天价员工首个成果，谷歌版o1算出最难高考数学题！物理代码难题闪电秒解

刚刚，GPT开山一作被曝离职OpenAI！被Ilya感谢，ChatGPT无名英雄选择单飞

2025英伟达奖学金名单公布，7位华人入选！中科大浙大校友在列，人均6万美元

全球百模争霸，国产大模型拿下多个冠军！智源FlagEval全球评测榜单出炉

一键生成万字专利！中科院发布多智能体框架AutoPatent，含1933个「草稿-专利」数据对

Meta斯坦福全新多模态Apollo，60分钟视频轻松理解！7B性能超越30B

招人！新智元邀你勇闯ASI之巅

OpenAI开通ChatGPT热线了！美国电话就能打，老人机也能玩，15分钟免费

全球最强GPU订单曝光，TOP 1微软一年买爆近50万块！xAI晒首批GB200提前过年

28年数据枯竭？AI炼出数据飞轮2.0，智能体+多模态数据湖硬核掘金

AI改变数学的一年！黎曼假说、朗兰兹猜想，盘点2024年数学里程碑

全面超越CoT！Meta田渊栋团队新作：连续思维链

2025年，AI Agent还会是风口吗？11个问题揭秘智能体技术发展全貌

招人！新智元邀你勇闯ASI之巅

OpenAI圣诞第9天：满血o1 API放出，开发者大狂欢！实时API升级音频token暴降60%

Pika 2.0横扫Sora惊艳全网，一键颠覆广告业！上传自拍秒变好莱坞大片，和明星同框不是梦

用上AI，升职提前4年？清华等分析6790万篇论文：科学界收缩，不用AI的领域无人问津

稳定学习预后标志物，多种癌症生存曲线证实！清华最新成果登Nature顶级子刊

沃顿商学院教授发文解析o1：能力仍有短板，「人机协同智能」或成AGI最重要难题

招人！新智元邀你勇闯ASI之巅

谷歌逆风翻盘暴击OpenAI，90天王者归来！44页报告押注25年三大技术前沿

举报人「自杀」，OpenAI表示震惊！NYU教授发长文悼念：警钟仍在回响

谷歌版Sora来了，4K高清暴击OpenAI！视频生图新卷王，更理解物理世界

ChatGPT搜索，全球免费！Her动嘴实时搜，暴打谷歌边聊边搜

北大开源全新图像压缩感知网络：参数量、推理时间大幅节省，性能显著提升 | 顶刊TPAMI

语言游戏让AI自我进化，谷歌DeepMind推出苏格拉底式学习

招人！新智元邀你勇闯ASI之巅

视频一键拆分PS层！DeepMind新模型效果碾压同级，物体、背景完美分离，还能脑补

图像领域再次与LLM一拍即合！idea撞车OpenAI强化微调，西湖大学发布图像链CoT

Nature再发招聘调查：学术界和工业界大不同，帮你避坑从简历到面试的N个细节

招人！新智元邀你勇闯ASI之巅

MIT教授NeurIPS歧视言论炸雷，中国女学生霸气反击！AI大佬集体痛斥，道歉信来了

OpenAI官方爆料，长文开怼马斯克：靠打官司实现不了AGI！

Claude 3.5编程收入暴增10倍，抢走Cursor反杀OpenAI！估值180亿初创3年颠覆硅谷

招人！新智元邀你勇闯ASI之巅

「中美科技合作协定」终于续签！但AI半导体等关键技术却遭排除

Ilya向全世界宣布：预训练结束了！全球AI数据耗尽，超级智能才是未来

26岁OpenAI举报人疑自杀！死前揭ChatGPT训练黑幕

欧洲万亿美元科技巨头为0，被美国「泰坦」无情碾压！LeCun转评

招人！新智元邀你勇闯ASI之巅

ChatGPT「睁眼」了！OpenAI版「Her」满血上线，还有圣诞限定彩蛋

LSTM之父：我也是注意力之父！1991年就发表线性复杂度，遥遥领先Transformer 26年

再也不怕显存爆炸了！高效重建「几何精准」的大规模复杂三维场景，中科院提出CityGaussianV2

Meta公布黑科技：戴上腕带即可隔空打字，引领神经接口AR革命

招人！新智元邀你勇闯ASI之巅

ChatGPT崩溃4小时！DDL打工人、期末大学生全慌了

2024 ACL Fellow名单出炉！微软高剑峰等4位华人科学家入选

OpenAI深夜被狙，谷歌Gemini 2.0掀翻牌桌！最强智能体组团击毙o1

谷歌Gemini再添猛将！GPA 5.0毕业即DeepMind高级科学家，开挂博士给科研新人7点建议

超图计算+目标检测，性能新SOTA！清华发布Hyper-YOLO：用超图捕捉高阶视觉关联

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉