语义连续优化：一种生成式AI辅助的语义通信框架

文摘科学 2024-08-20 17:18 河北

论文分享

GenAINet通信大模型

语义通信技术能够仅根据语义特征信息在接收端重建与原始图像语义等效的图像，从而有效降低通信负载，因此有望成为6G通信的关键技术。但当前的语义通信系统仍缺乏从精练的语义信息中构建复杂场景的能力，显然在平衡语义信息生成方法的有效性和传输信息的复杂性方面存在技术空白。为弥合这一差距，来自西北工业大学李立欣教授团队与三星剑桥AI研究中心、西安电子科技大学和休斯顿大学的研究团队提出了一种扩散模型增强语义通信框架。该框架融合了扩散模型在合成多媒体内容时保留语义特征的强大能力，通过高度压缩语义信息来减少带宽使用，使用扩散模型丰富图像的信息，确保与原始语义信息的一致性，实现对重建图像的语义连续优化。(本推文内容由论文作者提供）

Semantic Successive Refinement: A Generative AI-aided Semantic Communication Framework

Kexin Zhang¹, Lixin Li¹, Wensheng Lin¹, Yuna Yan¹, Rui Li², Wenchi Cheng³, and Zhu Han⁴

¹School of Electronics and Information, Northwestern Polytechnical University, Xi’an, China

²Samsung AI Cambridge Center, Cambridge CB1 2RE, U.K.

³State Key Laboratory of Integrated Services Networks, Xidian University, Xi’an, China

⁴Department of Electrical and Computer Engineering, University of Houston, Houston, US

原文链接：

https://arxiv.org/abs/2408.05112

本文分享仅用于技术交流，未经许可禁止用于商业用途。

一、引言

1.1 语义通信系统

语义通信系统如图1所示，过程包括：发送端利用语义知识库提取原始图像的语义信息，生成的语义特征序列送入信道编码模块后传输。接收端通过信道解码获得语义特征序列，再利用语义知识库进行解码和恢复，重建原始数据或直接用于分类、目标检测等任务。

许多语义通信系统采用基于深度学习的联合信源信道编/解码框架，这依赖于语义知识库提供的强先验知识，才能保证传输的有效性和可靠性。语义知识库作为数据压缩和重建的基础，需要通过发送端和接收端的交互进行构建，并在正式通信前部署。基于深度学习的系统将语义知识库嵌入神经网络的模型参数中，其训练、更新和部署相当于知识库的构建和维护。若发送端和接收端的语义知识库不匹配，通信性能将大幅下降。

图 1 语义通信系统的架构

1.2 扩散模型

作为一类基于似然度的模型，扩散模型包括两个过程，即正向扩散和反向推理。在正向扩散过程中，扩散模型逐渐向训练数据加入高斯噪声，直到数据完全变成纯噪声。在反向推理过程中，网络学习如何从噪声中恢复数据。

然而，经典的扩散模型需要在大型去噪模型上进行大量的迭代步骤，从而精确建模的数据细节，这会导致大量的计算资源消耗。不同于从头生成每个像素的图像合成任务，轻量化的条件扩散模型只需在解码器的噪声图像中添加准确细节，充分利用扩散模型强大的分布映射能力来恢复图像。这种机制与语义通信知识库的功能相似，知识库提供背景知识和上下文信息，使接收端能够有效地理解和重构传输内容。类似地，扩散模型通过学习逐步去除噪声来恢复数据细节，展现了从噪声中提取有用信息的能力。基于此，本文提出了一种生成式AI辅助的语义通信框架。

二、生成式AI辅助的语义通信框架

本文提出了一种针对下行传输场景的生成式语义通信框架，系统结构如图2所示。该框架不仅包括现有语义通信中的语义编解码器和信道编码器模块，还增加了一个核心模块，即语义微调模块。

图 2 生成式AI辅助语义通信系统结构

2.1 发送端

对于给定的图像集，首先对图像进行信息挖掘和特征提取。捕获的关键语义信息通过先进的Swin Transformer编码为潜在空间中的，其中H 和W 分别表示图像的高度和宽度，C 表示特征向量块的投影尺寸。

在训练阶段，为适应测试数据集的分辨率，解码器包含两阶段的Transformer架构，以确保模型能够捕获丰富的视觉特征。这种逐层处理不仅能快速识别图像的主要区域，还能深入挖掘细节，提高特征提取的准确性。此外，语义解码器遵循与编码器对称的逆结构。

2.2 接收端

针对语义解码后的失真图像，本文基于扩散模型开发了语义微调模块，其核心是一个轻量的扩散模型，包括两个主要网络：精简先验网络（）和图像重建网络（）。主要提取先验表征向量Z ，以减少传统扩散模型的计算负担；则利用来自预训练知识库的语义信息指导高质量图像的生成。经过语义微调，语义通信系统可以利用扩散模型在合成多媒体内容方面的优势，通过保留传输的语义信息来重建高质量图像。这种方法提高了数据传输效率，并优化了从有损信号中恢复复杂语义内容的能力，从而显著提升整体系统性能。

三、语义微调模块的训练过程

3.1 精简先验网络的训练

在训练过程中，首先将原始训练集图像与其对应的解码失真图像进行连接。接下来对合并后的图像进行下采样来作为的输入，在此过程中提取的向量用Z 表示，然后可以使用提取的向量Z 来恢复图像，过程如下：

这些图像与Unet形状的动态Transformer块堆叠在一起。动态Transformer块由动态多头转位注意力机制和动态门控前馈网络组成，它们可以利用作为动态调制参数，将恢复细节添加到特征图中，从而有效地聚合局部和全局空间特征。

3.2 图像重建网络的训练过程

主要通过扩散模型的有效数据估计函数从有损解码的图像中生成准确恢复的图像，这一过程包括两个关键部分：前向扩散和后向推理。首先，使用预训练的捕获解码图像的先验表征向量Z ，记为，并通过T 次迭代将的前向扩散过程应用于样本。每次迭代如下:

在扩散过程中，调度器在每个时刻都逐渐添加高斯噪声，直到图像的初始语义信息变成纯噪声：

式中，是一个已知的具有时间相关常数的方差表，而是一个单位矩阵O 的高斯噪声。

前向扩散过程是将数据噪声化，反向推理过程就是一个去噪的过程，推理阶段只使用反向扩散过程。与传统的DM算法在迭代过程中随机选择一个时刻来优化去噪网络不同，本模块可以使用更少的迭代和更小的模型尺寸来获得与传统扩散模型质量相当的估计。具体地说，从特定的时刻开始进行所有的去噪迭代，并将的先验表征向量发送给，与去噪网络进行联合优化。然后利用和估计每个时刻t 的噪声，得到：

经过T次迭代后，生成，然后再利用恢复语义信息图像。

四、实验结果

本文使用CIFAR10数据集进行训练和测试，采用DeepJSCC和经典基于分离的信源信道编码方案作为性能比较的基准。对于经典的传统通信方案，采用JPEG编解码器进行压缩，使用低密度奇偶校验码（LDPC）和正交调幅（QAM）方案对抗信道噪声或衰落，该方案记为JPEG+LDPC+QAM。

图3显示了不同信噪比（SNR）下生成式AI辅助语义通信（GSC）的PSNR性能。可以看到，对于传统的JPEG+LDPC+QAM方法，当信道恶化超过一个阈值（信噪比<3）时，接收端无法正确进行信道解码，因此无法正确传输任何语义信息。相比而言，当信噪比>6时，PSNR达到传统通信算法的饱和性能，此时的图像相似度评分几乎收敛到20，进一步增强信噪比并不能提高输出图像的质量。然而，随着信噪比的降低，传统方法的性能明显下降，且不如语义通信系统。由于语义信息可以通过微调模块得到增强，在低信噪比下，所提出的生成式AI辅助语义通信方案比DeepJSCC更具竞争力。

图 3 AWGN信道下的PSNR性能

图4显示了在瑞利衰落信道下使用生成式AI辅助语义通信和对比算法获得的信噪比的PSNR。尽管瑞利信道条件更为苛刻，但所提算法在语义通信中仍显示出优势。这是因为尽管LDPC编码和QAM调制增强了数据传输的鲁棒性，但JPEG压缩算法有性能损耗，可能导致不可逆的信息丢失，降低了整个系统的容错性，若出现传输错误，则会进一步导致图像质量下降或数据完整性下降。与DeepJSCC相比，该方法在较低信噪比下具有较小的性能差距，即使接收到的语义信息图像被严重破坏，仍能生成与原始传输语义信息一致的高保真图像。

图 4 PSNR性能 vs Rayleigh信道信噪比

为了分析语义微调模块的作用，还通过消融实验来验证所提出的方法，将所提出的生成式AI辅助语义通信方法与非生成框架（NGF）的图像传输性能进行了比较。NGF采用一个直接的语义接收器，但关闭了GSC的语义微调模块。以AWGN信道传输为例，图5比较了GSC和NGF在不同信噪比下传输图像的视觉效果。随着信噪比的提高（从左到右，信噪比范围从0 dB到15 dB），来自两个框架的图像从斑驳的马赛克样外观转变为更高质量的纹理，但在低信噪比下GSC的图像质量显著优于NGF。

图 5 AWGN信道中不同SNR下两种传输框架的图像细节。（a-f） NGF。（b-l） GSC。

五、结论

本研究提出了一种生成式AI辅助的语义通信系统，该系统引入了先进的、可解释的语义微调模块来增强语义信息。实验表明，与传统的通信方法和DeepJSCC相比，生成式AI辅助语义通信提供了更好的传输质量，显著改善了资源受限无线网络中的通信服务，即使是在低信噪比条件下，生成式AI辅助语义通信仍能恢复出质量较好的图像

GenAINet公众号简介

GenAINet公众号由IEEE Large Generative AI Models in Telecom (GenAINet) ETI成立，由GenAINet公众号运营团队负责维护并运行。

GenAINet公众号运营团队：

孙黎，彭程晖（华为技术有限公司）

杜清河，肖玉权，张朝阳（西安交通大学）

王锦光，俸萍（鹏城实验室）

编辑：张朝阳

校对：肖玉权

http://mp.weixin.qq.com/s?__biz=MzkxMTYzOTYzNw==&mid=2247484391&idx=1&sn=6be1f52a58e37a6e49b9bfa9a788ae53

GenAINet通信大模型

本公众号是IEEE Large Generative AI Models in Telecom (GenAINet) ETI 的中文媒体平台，介绍通信大模型相关的研究进展、业界动态、技术活动等。

最新文章

AIGC逆生成：实现像素级一致的高保真视频通信

IEEE OJCOMS征稿启事：生成式AI与大模型增强的6G无线通信与感知

通信大模型研究论文集（V2.0）

生成式人工智能驱动的车辆网络：基础、框架和案例研究

打破学科边界，点亮通信未来——通信大模型社区上线

语义通信和知识学习的相互作用

【大咖观点】TelecomGPT: 电信领域的专属大模型

IEEE Networking Letters征稿启事：基于生成式AI与大模型的边缘智能

WirelessAgent: 面向智能无线网络的大模型智能体

6G：从连接泛在到智慧泛在

用生成式人工智能实现低碳智能物联网——基于大语言模型的讨论

GenAINet ETI 第四次会议成功召开

网络大语言模型：应用、使能技术和挑战

GenAINet ETI 2024第二季度Newsletter

AI模型边云协作框架：云端大模型与边缘小模型协同分布式训练和部署

生成式人工智能在先进无人机网络中的应用

【延期至8月31日】IEEE Networking Letters征稿启事：人工智能在6G网络中的应用

语义连续优化：一种生成式AI辅助的语义通信框架

【延期至8月20日】IEEE GLOBECOM 2024 Workshop征稿启事：多模态大语言模型对6G的影响

TelecomGPT：面向电信领域的大语言模型

IEEE GLOBECOM 2024 Workshop征稿启事：下一代智能无线应急通信

第四届通算一体网络理论与技术研讨会成功召开

【8月7日】第四届通算一体网络理论与技术研讨会

RF-Diffusion：面向射频信号的生成式扩散模型

迈向智能通信：大模型使能的语义通信

IEEE Networking Letters征稿启事：人工智能在6G网络中的应用

大模型驱动的生成式图像语义传输：计算视觉赋能6G时间敏感网络通信范式

IEEE GLOBECOM 2024 Workshop征稿启事：多模态大语言模型对6G的影响

CDDM: 无线通信的信道去噪扩散模型

并行分割学习中的资源编排与调度优化

IEEE WF-IoT 2024 Workshop征稿启事：生成式人工智能增强的物联网系统

生成扩散模型(GDM)在Wi-Fi网络性能优化中的应用

【6月28日】IEEE Singapore 6G Summit：探讨大模型时代的无线前沿技术

GenAINet ETI 第三次会议成功召开

IEEE ComSoc GenAINet ETI 研讨会：用大语言模型重新定义电信

孙凝晖院士讲座：人工智能与智能计算的发展

通过提示工程优化移动边缘AI生成一切(AIGX)服务：基础，框架和案例研究

基于生成式AI与强化学习的Wi-Fi网络通算一体化方案

将大语言模型推向6G边缘

IEEE Vehicular Technology Magazine征稿启事：生成式人工智能在未来车联网中的应用

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉