生成式人工智能驱动的车辆网络:基础、框架和案例研究

文摘   科学   2024-10-24 14:47   上海  


论文分享

 GenAINet通信大模型 


生成式人工智能(Generative AI,GAI)具有生成真实数据和促进高级决策过程的能力,能够与车辆网络相结合,增强导航优化、交通预测、数据生成和评估等各种应用,在改进智能交通系统方面具有巨大的潜力。但GAI与车辆网络的集成仍面临着一些挑战,例如实时数据处理和决策,适应动态和不可预测的环境。为了解决这些挑战,来自新加坡南洋理工大学、北京交通大学、广东工业大学、加拿大滑铁卢大学以及美国普林斯顿大学的研究团队联合提出一个多模态语义感知框架来提高GAI在车辆网络中的服务质量。通过利用多模态和语义通信技术,该框架可以使用文本和图像数据来创建多模态内容,为接收车辆提供可靠的指导。最后,研究团队讨论了GAI车辆网络领域的潜在研究方向和预期进展。
(本推文内容由论文作者提供。)

Generative AI-Enabled Vehicular Networks: Fundamentals, Framework, and Case Study


Ruichen Zhang1,2, Ke Xiong1,3,4,5, Hongyang Du2, Dusit Niyato2Jiawen Kang6, Xuemin Shen7and H. Vincent Poor8


1School of Computer Science and Technology, Beijing Jiaotong University, China

2College of Computing and Data Science, Nanyang Technological University, Singapore

3Engineering Research Center of Network Management Technology for High Speed Railway of Ministry of Education, Beijing Jiaotong University, China

4Innovation Center of Railway Traffic Safety, Beijing Jiaotong University, China

5National Engineering Research Center of Advanced Network Technologies, Beijing Jiaotong University, China

6School of Automation, Guangdong University of Technology, China

7Department of Electrical and Computer Engineering, University of Waterloo, Canada

8Department of Electrical and Computer Engineering, Princeton University, USA


原文链接

https://ieeexplore.ieee.org/document/10506539

本文章已经发表在IEEE Network, 该分享仅用于技术交流,未经许可禁止用于商业用途。
1. 背景介绍
随着物联网(IoT)和连接设备的快速发展,车载网络已经成为现代交通系统的核心部分。它能够在车辆、基础设施和其他设备之间实现无缝通信,显著提升交通效率、安全性和可持续性。通过实时数据交换和协同决策,车载网络支持包括交通管理、自动驾驶、智慧城市规划等在内的多种应用。根据统计,全球车载网络市场预计将从2020年的约200亿美元增长至2026年的约700亿美元,年均增长率高达23.1%。到2025年,全球预计将有超过1.5亿辆联网车辆,这些车辆将能够与其他车辆、基础设施和云服务进行通信。研究表明,车载网络技术有望减少30%的交通事故,每年可节省约1900亿美元的社会成本。与此同时,全球连接车辆产生的数据量预计到2025年将达到1.5PB,这些数据将广泛用于实时交通管理、驾驶行为分析以及车辆维护。各国政府也在积极推动车联网相关政策的出台。例如,欧盟计划在2025年让所有新车具备V2X通信能力,进一步加速车联网技术的普及。
另一方面,随着AI技术的发展,GAI作为AI的一个分支越来越受到人们的关注。根据市场研究公司预测,GAI市场预计将在2023年至2030年间以超过30%的年复合增长率增长,预计到2030年GAI市场的估计价值将超过300亿美元。GAI专注于生成新的内容和数据,如图像、文本、音频、视频,甚至系统设计。GAI技术分为两大类:基于数据的技术和基于模型的技术。前者通过学习现有数据生成新内容,而后者则通过调整预定义模型参数来生成新的输出。这些技术在学习现实数据模式和结构方面表现出色,能够生成与真实世界非常相似的结果,使得机器具备模仿人类创造力和解决问题的能力。GAI在车载网络中的集成,尤其是与自动化内容创建相结合,能有效提升智能交通系统的效率。例如,GAI可以为驾驶员生成实时交通信息、天气预报及周边设施推荐。此外,它还可以生成驾驶场景模拟,如事故情况,从而提升真实环境下的操作效率。西门子移动等公司已通过AI技术生成实时交通预测,帮助更好地制定路线决策,减少交通拥堵,提升管理效率。
本文系统性地探讨了GAI在车载网络中的应用,解决了二者集成面临的一些关键问题。作者们的贡献总结如下:
  • 介绍了不同类型的GAI技术,并分析了它们在车载网络中的潜在应用及面临的挑战。
  • 提出了一种集成多模式架构的GAI车载网络框架,能够处理文本与图像数据,提供更可靠的车辆指导信息。
  • 在该框架下,设计了一种基于深度强化学习(DRL)的资源分配方法,旨在通过优化通信资源和GAI资源,最大化系统的服务质量。仿真结果验证了该方法的有效性。
2. GAI技术及其与车载网络的应用
图1 不同GAI技术的优缺点
深入了解适用于车载网络的生成式人工智能(GAI)技术,对于优化整体系统性能和提升用户体验至关重要。同时,开发人员必须认识到每种GAI技术的优势和局限性,以便在特定车载网络应用中采用最适合的策略。为此,作者们总结了各种GAI技术的优缺点,如图1所示。
通过结合先进的GAI技术,车载网络能够实时分析交通模式,并为驾驶员提供替代路线建议,避免拥堵或事故,如图2所示。这种技术的集成不仅提高了车辆的决策效率,也显著改善了用户的驾驶体验。为更加清晰地说明GAI在车载网络中的应用,现将其主要应用总结如下:
  • 导航和路线优化: GAI可用于根据实时交通数据、道路状况、天气和其他信息创建路径,从而优化车辆路线。
  • 交通模拟和预测: GAI可用于模拟和预测交通场景,帮助交通规划者和交通管理系统优化交通流量,减少拥堵。
  • 驾驶数据生成: GAI可用于创建驾驶数据,例如事故场景,以增强道路安全。
  • 保险和风险评估: GAI模型可用于分析驾驶行为、事故风险和其他因素,从而实现更可靠和个性化的保险定价和风险评估。
图2 GAI车载网络的示意图
3. GAI车辆网络的语义感知框架
图3 GAI支持的V2V框架
图左:传统的GAI支持的V2V框架。图右:基于GAI的车载网络多模态语义感知框架。
传统的GAI车辆可以在发送端使用语义通信技术从图像中提取信息,并在接收端使用GAI技术将其还原。该方法减少了传输数据量,降低了通信延迟,提高了车载网络的V2V通信效率。然而,现有的仅依赖基本文本信息的GAI模型仍然存在一个挑战:它们存在不确定性和不可靠性,使它们无法向其他车辆的智能助手提供精确的道路信息,这对于以安全为重点的车载网络来说是不可接受的。因此,车载网络需要一个更可靠、更高效的GAI框架来应对这些挑战,并提供精确的道路信息,以实现更好的决策和提高安全性。
在本节中,作者们介绍一种用于支持GAI的车载网络的多模态语义感知框架。该框架解决了传输图像和恢复图像之间存在较大差异的问题。框架步骤如下:
  • 步骤1。语义信息提取:与传统的GAI框架类似,第一步是从实时道路图像中提取语义信息。
  • 步骤2。图像骨架提取:图像骨架的提取非常重要,因为它提供了图像的基本结构,是提取更高级语义信息的基础。
  • 步骤3。无线传输:在提取图像骨架和文本信息后,将它们组合成一个紧凑的数据包。然后,该数据包通过V2V通信无线传输到接收车辆。

  • 步骤4。支持GAI的图像生成:GAI模型使用提取的图像骨架和语义信息生成与实际图像非常相似的路况图像.

  • 步骤5。图像重建:在接收端重建生成的路况图像,并提供给智能助手,提醒驾驶员注意潜在的危险。智能助手分析重建图像,并将其与当前路况进行比较,以识别潜在的危险,如事故或路障。

针对所考虑的问题,作者们提出了一种基于双深度Q网络(Double Deep Q-Network,DDQN)的方法来解决GAI支持的V2V通信中的资源分配问题。DDQN是一种深度强化学习技术,它使用两个神经网络,即在线网络和目标网络,来近似Q值函数。具体来说,在线网络根据当前状态选择动作,而目标网络则用来估计后续状态的Q值。基于DDQN的方法增强了训练过程的稳定性,防止了Q值的高估。

图4显示了多模态语义感知GAI支持的V2V示例,其中从捕获的路况图像中提取接收到的图像骨架。由图可知,在安装了语义编码器的接收车辆中,呈现了生成图像的提示词的关键字的语义信息,其中图像表示通过不同的亮度级别反映了每个关键字的重要性;亮度越高,表示相应关键字的权重越大。原因是在图像生成过程中,设计了语义信息,智能地强调特定的关键词,便于基于图像骨架和文本提示创建更可靠的交通图像,从而对路况有更清晰、更全面的了解。

图4 多模态GAI中图像语义信息的压缩

图5 仿真结果

在训练阶段,图5(a)是四种资源分配策略随着迭代次数的增加所获得的平均奖励的对比,结果表明,与基于贪婪和基于随机的方法相比,所提出的基于DDQN的方法始终获得更高的奖励,并且收敛速度更快。图5(b)显示了四种类型的资源分配策略在图像负载大小下获得的体验质量(Quality of Experience,QoE)。可以看出,所提出的基于DDQN的方法优于其他基准测试。图像有效载荷的增加有利于系统的QoE,因为更大的有效载荷意味着更多的实质传递的语义信息量。从图5(c)观察到,所提出的基于DDQN的方法优于其他基准测试,其中在随机和贪婪情况下成功传输的数据量始终为0。此外,随着图像有效载荷的增加,成功传输图像的平均数据量先上升后下降。这种现象可能是由于车载网络拥塞和高负载条件下丢包概率增加。因此,重传的次数可能会增加,从而降低总体传输成功率。
4. 总结
在本文中,作者们介绍了GAI车载网络,重点介绍了GAI技术及其应用场景。随后,作者们提出了一个多模态语义感知框架,旨在提高GAI的服务质量,该框架包含语义和多模态技术。为了进一步提高系统传输效率,作者们提出了一种基于DRL的方法来解决GAI支持的V2V资源分配问题。仿真结果验证了该方法的有效性。最后,作者们总结了GAI车载网络领域的潜在研究方向。
参考文献:
[1]. Z. Yang, Y. Chai, D. Anguelov, Y. Zhou, P. Sun, D. Erhan, S. Rafferty, and H. Kretzschmar, “Surfelgan: Synthesizing realistic sensor data for autonomous driving,” in Proc. IEEE CVPR, June 2020.
[2]. H. Du, R. Zhang et al., "Exploring Collaborative Distributed Diffusion-Based AI-Generated Content (AIGC) in Wireless Networks," IEEE Network, vol. 38, no. 3, pp. 178-186, May 2024.
[3]. C. Mou, X. Wang, L. Xie, Y. Wu, J. Zhang, Z. Qi, Y. Shan, and X. Qie, “T2I-Adapter: Learning adapters to dig out more controllable ability for text-to-image diffusion models,” 2023.
[4]. S. Kong and C. C. Fowlkes, “Recurrent pixel embedding for instance grouping,” in Proc. IEEE CVPR, June 2018.
[5]. R. Zhang et al., "Interactive AI with Retrieval-Augmented Generation for Next Generation Networking," IEEE Network, 2024.
[6]. E. A. van Dis, J. Bollen, W. Zuidema, R. van Rooij, and C. L. Bockting, “ChatGPT: Five priorities for research,” Nature, vol. 614, no. 7947, pp.224–226, 2023. 
[7]. R. Zhang et al., "Generative AI for Space-Air-Ground Integrated Networks," IEEE Wireless Commun, 2024.
[8]. H. Du, R. Zhang, et al., "Enhancing Deep Reinforcement Learning: A Tutorial on Generative Diffusion Models in Network Optimization," IEEE Commun. Survey Tutorials, 2024.
[9]. H. Du, Z. Li, D. Niyato, J. Kang, Z. Xiong, Xuemin, Shen, and D. I.Kim, “Enabling AI-generated content (AIGC) services in wireless edge networks,” 2023.
[10]. R. Zhang et al., "Generative AI Agents with Large Language Model for Satellite Networks via a Mixture of Experts Transmission," in IEEE J. Sel. Areas Commun., 2024.
[11]. R. Zhang, K. Xiong, and Y. Lu, et al., “Joint coordinated beamforming and power splitting ratio optimization in MU-MISO SWIPT-enabled hetnets: A multi-agent DDQN-based approach,” IEEE J. Sel. Areas Commun., vol. 40, no. 2, pp. 677–693, 2022.
[12]. R. Zhang, K. Xiong, Y. Lu, P. Fan, D. W. K. Ng, and K. B. Letaief, “Energy efficiency maximization in RIS-assisted SWIPT networks with RSMA: A PPO-based approach,” IEEE J. Sel. Areas Commun., 2024

GenAINet公众号简介

GenAINet公众号由IEEE Large Generative AI Models in Telecom (GenAINet) ETI成立,由GenAINet公众号运营团队负责维护并运行。

GenAINet公众号运营团队:

孙黎,彭程晖 (华为技术有限公司)

杜清河,肖玉权,张朝阳 (西安交通大学)

王锦光,俸萍 (鹏城实验室)

编辑:张朝阳
校对:肖玉权

GenAINet通信大模型
本公众号是IEEE Large Generative AI Models in Telecom (GenAINet) ETI 的中文媒体平台,介绍通信大模型相关的研究进展、业界动态、技术活动等。
 最新文章