WirelessAgent: 面向智能无线网络的大模型智能体

文摘 2024-09-24 17:04 陕西

大家好！今天和大家分享我们团队的最新研究成果《WirelessAgent: Large Language Model Agents for Intelligent Wireless Networks》。在这个工作中，我们定义了一种全新的无线智能体——WirelessAgent。它是一种基于大型语言模型 (LLM) 开发的、能够自动完成无线网络中复杂任务的智能体新方法。WirelessAgent旨在通过高效推理、多模态数据处理和自主决策来实现智能化和自主化的无线网络管理，提升通信系统性能。我们将其应用于网络切片管理任务，测试结果表明WirelessAgent 能够准确理解用户意图、自动分配切片资源并保持比传统方法更低的资源占用率。下面一起来了解WirelessAgent是如何工作的吧！

论文链接：https://arxiv.org/abs/2409.07964

GitHub链接：https://github.com/weiiguo/Wireless-Agent （更新中）

团队主页：https://eejzhang.people.ust.hk/

1. 背景介绍：从LLMs到Agents

在当今高度互联的社会中，无线通信不仅是信息交流的基石，更是推动各行各业变革与创新的关键力量。随着技术的飞速发展，无线网络环境变得日益复杂，使得传统网络优化方法面临诸多挑战，难以满足日趋增长的性能需求。这一现状促使业界与学术界将目光投向人工智能（AI），即将前沿AI技术深度融入未来网络中，以应对复杂挑战，提升系统效能[1]。

然而，当前的AI解决方案往往聚焦于特定场景，缺乏跨领域应用的通用性和灵活性。这迫切需要一种更加多功能、泛化能力强的AI算法[2]。在此背景下，大型语言模型（LLMs）如ChatGPT等凭借其卓越的人类级文本理解与认知能力，引起了广泛关注。LLMs不仅在推理与决策方面展现出强大实力，而且随着多模态生成人工智能（如GPT-4及后续迭代）的兴起，通过整合多种类型信息，进一步增强了其功能边界。结合外部知识库，这些模型能够提供更加精准、全面的响应，为无线通信领域的智能化转型开辟了新路径。

但是，通用语言任务与无线网络中的实际应用之间存在着天然的差距。许多关于 LLM 的研究仅限于电信语言理解的直接应用[3]。LLM 作为智能自主代理来管理和优化网络运营的全部能力仍未得到充分开发。因此，我们提出WirelessAgent的概念，它定义了一个全新的智能体框架，为LLMs赋予了感知、记忆、规划与行动四大核心模块，旨在通过集成外部知识库，实现无线任务的自动化与智能化管理。通过高效推理机制、多模态数据处理能力及自主决策能力，WirelessAgent能够有效应对无线网络中的复杂任务，显著提升网络整体性能。在网络切片管理任务中，WirelessAgent能够深刻理解用户需求，精准分配网络资源，并有效维护网络性能，为无线通信网络的智能化、高效化运营提供了强有力的支撑。

2. 智能体：概念、发展与准则

智能体是一种能够感知环境并采取行动以实现特定目标的系统。智能体的演进过程包括以下几个阶段：

符号智能体：基于逻辑推理和符号表示。使用明确的规则和知识库来做决策。优势在于清晰的推理过程，但灵活性和适应性较差。
反应式智能体：不使用内部模型，仅根据当前感知直接做出反应。优势在于快速响应和低计算需求，但缺乏长远规划能力。
基于强化学习的智能体：通过与环境互动获得奖励，从而学习最佳策略。具备自适应能力，能处理复杂任务。需要大量数据和计算资源进行训练。
LLM驱动的智能体：使用大语言模型处理自然语言并做出决策。能理解和生成复杂的语言，具有推理和决策能力。可以整合多模态信息，具备更高的灵活性和智能性。

本文旨在将LLM驱动的智能体集成到无线网络中，实现通信系统中各种复杂任务的自动化管理。这种无线智能体应遵循如下准则：

交互性：智能体应有效地与人类、无线环境和其他智能体进行交互。它们必须适应不同的系统和协议来收集信息并优化性能。而且，智能体之间的协作对于不同网络中的决策和资源管理也至关重要。
自主性：智能体应独立运作，控制其行为和状态。他们需要在没有详细说明的情况下执行任务，响应变化并调整策略以防止无线系统中断，影响客户的服务体验。
自我演进：智能体应持续学习并逐渐适应环境。智能体应根据交互和反馈更新其知识，使用强化学习等高级 AI 技术来应对新挑战并随着时间的推移不断改进。

3. WirelessAgent:面向无线网络的智能体

图1 WirelessAgent的总体概览，从左到右依次为关键支撑、核心模块和基础用法

我们基于以上准则设计了WirelessAgent的总体框架，如图1所示。该框架利用大模型的高阶能力和无线网络的领域知识来构建无线智能体。在设计理念上，我们将WirelessAgent类比为一个人，即通过模拟人类感知和响应系统来实现结构化的工作流程。从感知模块理解自然语言和多模态无线数据开始，到记忆模块存储和检索信息，再到规划模块处理信息和做出决策，最后行动模块执行任务，形成一个循环过程，实现与外部世界的持续反馈和动态交互。其核心模块的功能如下所示：

感知模块：感知模块是WirelessAgent与外部世界交互的首要环节，它的作用类似于人类的感官器官，负责理解和处理输入的信息，包含两个关键功能：

文本理解：利用大模型的高级能力，该功能使WirelessAgent能够理解和响应人类以及其他智能体发出的复杂指令。除此之外，通过使用特定数据集和专业语料库对大模型进行微调，WirelessAgent能够理解无线通信中使用的复杂术语；
多模态数据处理：该功能通过传感器感知环境并收集多模态数据，如视觉和无线信号，这些多模态数据拥有丰富的信息可以帮助WirelessAgent更精准地感知环境。为了帮助WirelessAgent处理多模态数据，一个比较简单可行的方法是将这些数据转换成文本描述，这样既易于解释，也无需额外的训练。

记忆模块：记忆模块使WirelessAgent能够全面分析过去和当前的数据，增强其在无线智能应用中管理动态信息的能力，该模块包括两个关键功能：

记忆写入：在感知到观察结果后，智能体将通过记忆写入操作存储其中的一部分以供进一步使用。此外，过去的错误、成功的干预以及从这些经验中得出的学习行为都会被记录下来以供将来参考；
记忆管理：组织和索引历史记忆，从而帮助高效地检索数据，并且减少内存的占用。与人脑类似，记忆模块通过长期记忆支持快思考的自动化和直觉反应，而通过短期和工作记忆支持慢思考的深思熟虑和分析能力。长期记忆帮助快速识别切片管理模式和经验，节省时间和资源；短期和工作记忆则在复杂问题中进行信息处理和评估，提高决策准确性。

规划模块：规划模块是WirelessAgent的核心，它通过组织任务、规划步骤和监控进度来帮助完成复杂任务。具体而言，其包括三个核心子模块：

推理子模块：该子模块对于智能体处理复杂任务起着核心作用，利用上下文学习（In-Context Learning，ICL）和思维链（Chain-of-Thought，CoT）等提示工程技术，智能体可以将复杂任务逐步分解成可管理的简单子任务，并且制定相应的策略；
检索子模块：该子模块可以使得智能体访问超出其训练数据的信息，比如通过检索增强生成（Retrieval-Augmented Generation, RAG）技术，WirelessAgent可以始终检索最新的通信协议、先进技术等，从而增强规划能力；
反思子模块：该子模块模仿人类决策中的认知学习过程，分为“行动前反思”和“行动后反思”两种方式，从不同方面提升决策质量。“行动前反思”方式是在做出决策或采取行动之前仔细考虑情况。它涉及反思观察结果与最终无线网络性能之间的关系，在提供的信息和结果之间建立联系。“行动后反思”方式分析事件或行动后的结果，它检查过去的决策、跟踪行动和后续结果，以从过去的成功或错误中吸取教训。

行动模块：行动模块负责执行规划模块的命令，与环境进行互动，主要包括两个核心能力：

文本生成能力：利用基于Transformer的生成模型，WirelessAgent能够生成文本和人类，其他智能体以及自己不同模块之间进行沟通，确保用户的需求被理解，但这类模型通常会产生幻觉，当应对无线系统的任务时，需要保证其与底层通信原理和系统约束的一致性，解决幻觉的技术通常包括微调，或者基于人类反馈的强化学习等；
工具操作：WirelessAgent具有调用和操作外部工具的能力，在应对复杂任务该能力可以简化操作流程并提高决策效率。专用工具（例如 Python、Matlab 和 Huggingface 平台）可帮助 WirelessAgent提高性能、适应特定领域并以模块化方式满足这些领域的独特要求。例如，传播预测软件使用 Matlab 软件中计算效率高的射线追踪算法，可以生成各种环境中电磁波行为的准确且可解释的模拟。这在电信等领域至关重要，因为了解信号传播可以直接影响网络的设计和优化。

WirelessAgent 各模块之间构成了两种主要的工作流程。第一个工作流程从感知模块到记忆、规划和行动模块。此流程确保 WirelessAgent 能够遵循交互和自主原则;第二个工作流程从规划模块到行动、记忆再到规划模块。此流程使 WirelessAgent 能够自我改进，增强其智能性和实用性。接下来，我们将 WirelessAgent应用于网络切片管理任务。

4. 实例分析：网络切片管理

网络切片（Network Slicing）是5G和B5G网络中的一个关键概念，旨在提供定制的网络服务以满足不同的需求[4]。它使多个虚拟网络（或切片）能够在共享的物理基础设施上共存。网络切片主要有三种类型：增强移动宽带 (eMBB)：这些切片专注于高数据速率和容量；超可靠低延迟通信 (URLLC)：此类型提供极低的延迟和高可靠性，非常适合自动驾驶汽车等应用；大规模机器类型通信 (mMTC)：这些切片支持许多低功耗、低数据速率的物联网设备。每种切片类型都根据特定要求量身定制，以确保用户的服务体验。

网络切片管理（Network Slicing Management）通过隔离、定制化、动态管理和自适应调整来实现了网络资源的高效利用和用户服务质量保障。为了实现该目标，传统切片方法通过预定义的策略进行资源分配。然而，该方法响应速度有限，且往往难以应对无线网络的复杂性和动态性。这种现象在密集网络中变得更加严重。我们介绍一种基于 WirelessAgent 的网络切片管理方法，旨在用智能体取代传统的网络切片控制器。

4.1 基于WirelessAgent的网络切片管理

图2 基于WirelessAgent的网络切片管理流程图

首先，我们给出基于 WirelessAgent 的网络切片管理方法的流程图，如图2所示。它主要由两部分组成：第一部分是包括人机交互和网络条件的外部环境。第二部分是 WirelessAgent，主要是其各模块在网络切片管理中的具体实现。为了解WirelessAgent是如何完成网络切片管理任务的，下面我们对各模块进行详细介绍：

感知模块：感知模块通过文本理解和多模态处理功能，有效地处理两类输入信息。第一类包括用户特征，例如用户的ID、位置、CSI和特定要求等；第二类涉及网络条件，例如网络中用户数量和不同切片的状态。例如，如图2所示，一个新用户进入蜂窝网络并向BS发送请求。WirelessAgent感知到新用户的ID为53，其位置为（60, 75）m。此外，蜂窝网络中的信息包括：用户总数以及eMBB和URLLC切片状态的信息（例如，eMBB和URLLC切片的当前资源占用率分别为100％和73.3％）。最后，该信息存储在记忆模块中并传送到规划模块进行进一步处理。
记忆模块：记忆模块存储和管理两种主要类型的信息：感知数据和动作记录。首先，感知数据识别外部环境的各种状态，使 WirelessAgent 能够在已知状态下识别新用户时快速做出反应。其次，动作记录帮助 WirelessAgent 反思其行为并避免重复犯错。
规划模块：规划模块是 WirelessAgent 工作流中的关键模块，它通过组织任务、概述步骤以及使用推理、检索和反思功能监控进度来促进网络切片管理。如图 2 所示，WirelessAgent 将网络切片任务分为五个子任务：意图理解、用户注册、切片优化、QoS 评估和切片切换。接下来，我们以用53为例详细说明这些步骤：1）意图理解：此步骤识别用户的服务需求。例如，如果用户53想要观看4K视频，则应分配具有高数据速率和低延迟的资源。此步骤利用上下文学习技术为用户 53 推荐 12-15 Mb/s 的数据速率范围和 90 ms的延迟。2）用户注册：根据建议和切片决策边界，此步骤将用户分配到适当的切片。例如，用户 53 被分配到 eMBB 切片，因为它满足数据速率 2-20 Mb/s 和延迟 1-5 ms 的条件。3）切片优化：此步骤根据用户的 CSI 和切片状态，使用波束成形算法确定用户的数据速率和延迟。对于用户 53，应用迫零波束成形算法 (ZFBF) 算法，分配 12 Mb/s 的数据速率。这涉及检索内部内存和使用外部工具。4）QoS 评估：此步骤检查分配结果是否满足所有用户要求。如果不满足，WirelessAgent 会调整资源，并可能在切片切换步骤中将用户重新分配到不同的切片；否则，优化结果将最终确定。例如，在图2中，因为用户 53 需要更高的数据速率使得eMBB 切片无法支持 21 个用户，此时需要进行调整。5）切片切换：根据评估结果，此步骤重新评估所有用户的需求并根据需要重新分配。例如，用户 110 和 115 可能会从 eMBB 切片移至 URLLC 切片，以满足用户 53 的数据速率需求。切换后，必须重新分配资源，从而促使WirelessAgent的工作流程重新返回切片优化和 QoS 评估步骤。这个循环过程展示了代理的反思能力。
行动模块：行动模块主要执行来自规划模块的命令，完成内部和外部环境的交互。在切片优化步骤中，行动模块选择不同的波束成形和切换算法来最大化网络性能。最后，它能以文本的形式输出所有用户的分配结果。

可以看到，基于 WirelessAgent 的网络切片管理方法的工作流程为：第一，从外部环境到感知、规划、行动和外部环境；第二，从规划到行动、记忆再到规划。接下来，我们将展示 WirelessAgent 可以通过遵循这两个工作流程来有效地处理网络切片管理任务。

4.2 实验设置与性能分析

实验考虑一个由 120 个用户组成的网络，用户 ID 范围从 1 到 120，均匀分布在 (450X450) $m^2$ 的区域内。WirelessAgent 部署在位于该区域中心的基站。用户随机到达，每轮只有一个用户向基站请求服务。根据用户需求，WirelessAgent 必须分配资源来支持用户的服务，即网络切片管理。WirelessAgent 的目标是通过基于用户需求和网络条件自主执行网络切片管理来最小化资源占用率。实验考虑两种类型的切片（即 URLLC 和 eMBB），其中 URLLC 和 eMBB 切片分别具有 30 和 90 个资源块 (RB)。每个 RB 可以支持不同的子载波和功率。为了方便，这里假设每个 RB 仅支持 1 Mb/s 的数据速率。URLLC 和 eMBB 切片的决策范围分别为1-5 Mb/s 和 5-20 Mb/s。例如，如果某项服务需要 10 Mb/s，则在用户注册步骤中，它将被分配给 eMBB 切片。实验中决策范围之间存在重叠，允许根据切片管理算法将用户分配给 eMBB 或 URLLC 切片。

该实验是在对话交互环境中进行的。我们采用 GPT-4o-128K 语言模型的应用程序编程接口 (API) 作为 WirelessAgent 中管理网络切片的核心模块。图3 给出了 WirelessAgent 实现的一个示例，其中设计了主要提示词来指导 WirelessAgent 的工作流程，该工作流程使用遵循思维链（CoT）技术路线：将复杂任务分解为多个子任务。可以看出，WirelessAgent 利用上下文学习（ICT）、反思和工具操作功能来完成不同的子任务。每次新用户到来后，WirelessAgent 给其分配合适的资源，保证其服务质量。此实验按用户到达顺序进行，直到最终用户得到容纳。

图3 WirelessAgent用于网络切片管理任务中的一个示例

实验采用WirelessAgent 的切片管理方法与 [5] 中描述的传统切片管理方法进行了比较。在传统方法中，切片管理策略是预定义的，即用户的切片类型是预先判断得知，并其且分配给用户的 RBs 在相应切片的决策范围内随机分配。图 4 给出了传统和基于 WirelessAgent 的切片管理方法的资源占用率柱状图。从图中可以得到三个结论：第一，WirelessAgent 的资源占用率一直低于传统方法。例如，当蜂窝网络中有10个用户时，传统方法消耗 60% 的 RB 资源，而 WirelessAgent 仅消耗 53.3% 的资源。第二，WirelessAgent 可以通过动态调整每个用户的 RB 来支持比传统方法更多的用户。例如，当网络中用户数量为 30 时，WirelessAgent 在 eMBB 切片中可以支持 15 个用户，而传统方法仅支持 8 个用户。第三，WirelessAgent 通过执行切片切换算法来提高网络性能。例如，当用户总数为 25 时，并且eMBB切片的 RB 已耗尽，WirelessAgent 通过将重叠区域中的用户（即图 2 中的用户 110 和 115）从 eMBB 切片移动到 URLLC 切片来重新分配用户，提高系统容量。以上结果表明，WirelessAgent 可以智能、自主地处理网络切片管理任务，提升系统能效。

图4 传统和基于WirelessAgent的网络切片管理方法的资源占用率

5. 总结和展望

本文介绍了一种新的智能体架构——WirelessAgent，该架构融合大型语言模型的先进能力，旨在自主管理无线网络中复杂的任务。WirelessAgent以感知、记忆、规划与行动四大核心模块为基石，通过聚焦于网络切片管理的具体实践，验证了其卓越的有效性与适应性。测试结果表明，WirelessAgent能够准确理解悉用户意图、优化资源分配及应对高负载情境下超越了传统方法的优越性能。

展望未来，对于WirelessAgent，我们将聚焦于四大方向深化探索：一、强化多模态数据的无缝集成，探索前沿编码技术与融合策略，以拓宽智能体的感知边界；二、开发可解释的无线AI技术，确保每一个决策过程的透明，增强用户的信任与依赖；三、加固安全与隐私防线，守护网络空间的纯净与安宁；四、加速推进WirelessAgent在实际无线网络场景中的部署与评估，克服可扩展性与基础设施整合的挑战。

最近，OpenAI发布了一系列新型o1模型，旨在通过更充分的思考和推理来实现更准确的反应。这些模型能够处理复杂的任务，解决以前的科学、编码和数学模型难以解决的问题。可以预见，基于o1模型构建的WirelessAgent有望提供更精准的建议与解决方案，引领智能体步入一个反应更迅捷、决策更精准的全新时代。特别是o1模型在思维链（CoT）上的进展，使得WirelessAgent能够摆脱对人工预设主提示词的依赖，仅需精准的输入、足够的内存及对外部工具的控制，即可自主完成复杂的推理过程。我们知道在自动驾驶领域，智能化水平从低到高分为L0到L5级。相应地，在智能无线网络领域，我们认为WirelessAgent目前还处于一个比较初级的阶段。但随着新的大模型发布和模块整合能力的提升，WirelessAgent有望达到更高等级的智能化水平，直至实现完全自主化的无线网络管理。这将为无线网络带来革命性的变化，使其更加智能、高效、便捷。

参考文献：

[1] K. B. Letaief, W. Chen, Y. Shi, J. Zhang, and Y.-J. A. Zhang, “The roadmap to 6G: AI empowered wireless networks,” IEEE Commun. Mag., vol. 57, pp. 84–90, Aug. 2019.

[2] J. Shao, J. Tong, Q. Wu, W. Guo, Z. Li, Z. Lin, and J. Zhang, “WirelessLLM: Empowering large language models towards wireless intelligence,” J. Commun. Inf. Netw., vol. 9, pp. 99–112, Jun. 2024.

[3] O. Erak, N. Alabbasi, O. Alhussein, I. Lotfi, A. Hussein, S. Muhaidat, and M. Debbah, “Leveraging fine-tuned retrieval-augmented genera- tion with long-context support: For 3GPP standards,” arXiv preprint arXiv:2408.11775, 2024.

[4] R. Li, Z. Zhao, Q. Sun, I. Chih-Lin, C. Yang, X. Chen, M. Zhao, and H. Zhang, “Deep reinforcement learning for resource management in network slicing,” IEEE Access, vol. 6, pp. 74429–74441, Jun. 2018.

[5] H. Zhang, N. Liu, X. Chu, K. Long, A.-H. Aghvami, and V. C. Leung, “Network slicing based 5G and future mobile networks: Mobility, resource management, and challenges,” IEEE Commun. Mag., vol. 55, pp. 138–145, Aug. 2017.

作者：Jingwen Tong, Jiawei Shao, Qiong Wu, Wei Guo, Zijian Li, Zehong Lin, Jun Zhang

审阅：Qiong Wu & Wei Guo

编辑：Zehong Lin

在此之前，本团队探索了大型语言模型在无线通信领域的应用，设计一种全新的WirelessLLM框架，详情请见文章《WirelessLLM: 面向无线智能的通信大模型》，点击以下链接即可跳转：

本团队也探索了GPT-4在边缘计算和无线感知中的重要应用，并将GPT-4与边缘计算相结合，提出了EdgeGPT，详情请见文章《EdgeGPT: GPT-4邂逅边缘计算与6G》，点击以下链接即可跳转：

在6G当中，GPT-4还将在数据生成数据分析语义通信中扮演重要作用，详情请见本公众号之前的文章《ChatGPT碰撞6G》，点击以下链接即可跳转：

http://mp.weixin.qq.com/s?__biz=MzkxMTYzOTYzNw==&mid=2247484464&idx=1&sn=c1759722719b7c51fff502305ca34de2

GenAINet通信大模型

本公众号是IEEE Large Generative AI Models in Telecom (GenAINet) ETI 的中文媒体平台，介绍通信大模型相关的研究进展、业界动态、技术活动等。