Agent视域下的人工智能赋能作战系统

科技 2024-12-19 14:07 北京

本文发表于《指挥控制与仿真》2024年第6期

刘伟, 谢海斌, 陈少飞. Agent视域下的人工智能赋能作战系统[J]. 指挥控制与仿真. 2024, 46(6): 8-14.

摘要：针对作战系统的智能化设计问题,提出了基于Agent的人工智能技术概念框架和应用方法。首先,阐述了Agent概念,讨论了在作战系统中研究Agent的重要意义。然后,介绍了基于Agent的人工智能研究框架,列举了Agent在作战系统中的多种应用方式。最后,分析了Agent技术发展趋势及其作战应用可能面临的风险与挑战。

作战系统是指为实现特定作战目标而设计的技术系统和组织结构的总和,包括情报采集、目标识别、威胁判断、任务规划和战术执行等功能模块。现代战争具有作战要素复杂、多域交叉融合、一体化联合作战的特点,要求部队具备高度适应性和快速反应能力,武器装备应具有强机动性和协作性特点,作战系统整体亟待智能化升级。人工智能技术可增强作战系统的态势感知能力、指挥控制能力、决策效率以及军事行动的精准度和快速响应能力,但是如何在统一框架下进行作战系统的一体化智能设计和升级改造仍是一个待研究的重要课题。

本文提出了基于Agent的作战系统人工智能技术框架和应用方法,通过将多域、多维作战空间的实体要素纳入统一的研究框架,探讨了Agent在作战系统中的应用方式,从而为作战系统赋予自主性、反应性和适应性等关键特性,增强作战系统自主能力,促进多Agent协作,提高复杂环境适应能力。

1 Agent概念与内涵

1.1 Agent基本概念

一般认为,Agent是能够通过传感器感知环境,并且通过执行器对环境产生影响的任何事物。Agent概念具有强包容性,能够将所有对环境进行感知和施加影响的个体包容到统一的框架下研究,无论是生命体还是人造物。作战系统涉及多样化的平台和要素,如人类战士、无人作战装备、智能软件等,它们都可以被囊括到Agent范畴内进行设计和分析。

多Agent系统由多个Agent组成,通过交互来解决超出个体能力或知识范围的问题。现代战争涉及多域作战,需要多兵种协同、有人与无人协同、实体与虚拟空间作战能力相结合。多Agent系统为研究解决作战行动中的分布式问题提供了概念框架,可基于Agent交互实现分布异构实体间的有效组织、通信和协作。

1.2 研究Agent的意义

在作战系统中,研究Agent的意义主要体现在以下方面。

1)利用Agent的自主性和智能性,提高作战决策质量和行动速度。基于Agent统一设计作战系统,可使各功能模块间具有良好的兼容性和可扩展性,提升高强度对抗环境下的情报分析、态势感知、规划决策和行动执行能力。

2)Agent内部处理机制具有多样性,可为作战功能模块提供技术选择的灵活性。Agent强调智能的外在表现,可根据任务环境属性选择适合的人工智能技术,不局限于仿人理性思维或仿神经系统信息处理。

3)通过不断学习和适应,Agent能够更好地应对复杂战场环境。Agent不断感知环境并对环境施加作用,根据交互体验修正内建环境模型,改善感知与行动之间的映射关系。Agent凭借学习与进化能力,可打破其预设的能力界限,适应动态、不确定的开放环境。

2 基于Agent的建模方法研究现状

基于Agent的建模是目前解决作战复杂适应系统建模仿真最有效的方法之一。作战Agent是各类作战实体(层次、粒度可能不同)在仿真系统中的映射,也是基于Agent建模仿真的核心要素。Agent体系结构是从规约到实现这一中间步骤的表示,涉及系统结构选择和框架设计、模块分解与关系确定以及感知与行动机制建模等多个方面。

随着基于Agent的建模方法在实际建模仿真中的应用,面向Agent的软件工程概念应运而生,先后提出了基于知识工程的方法、基于对象技术的方法、基于角色和组织模型的方法等面向Agent的软件工程方法学。但是,在实际应用中发现,计算机仿真工程技术人员建立的仿真模型与军事人员建立的军事概念模型之间往往存在不一致性,需要经过反复的迭代修正,才能满足军事需求。因此,研究人员提出了用军事概念模型直接驱动多Agent作战仿真模型的建模方法,在保证仿真可信性的前提下,提高工程开发效率。

研究战争这类复杂系统对于动态环境的适应性,需要借助基于多Agent建模仿真方法。基于多Agent作战建模仿真是利用Agent对作战复杂系统中各个实体构建模型,通过对作战Agent个体及相互之间(包括与作战环境)的行为刻画,描述作战复杂系统的宏观行为。相对于传统面向过程和面向对象的仿真技术,基于多Agent仿真方法对复杂系统的行为具有更强的建模与仿真能力、更高的抽象性和表达能力、更强的仿真动态性和灵活性,实现了微观行为和宏观行为的有机结合,是研究作战复杂系统的重要手段。

在多Agent仿真中,人们重视Agent适应性对作战仿真过程及其结果的影响,取得了丰硕的研究成果。如王步云等梳理了遗传算法、强化学习、神经网络等方法在实现作战Agent适应性方面的成果;石鼎等从均衡决策的角度提出强化学习驱动的多Agent协同作战仿真算法。但是现有的研究往往只实现某一方Agent的适应性,作为对抗中的另一方仍然采用固定规则的决策模式。在仿真中如何实现红蓝双方的同时学习、学习过程是否能够收敛、对作战仿真结果有何影响,都是有待深入研究的问题。由于作战任务更加复杂,作战系统组成更加多样,有必要研究构建能够涵盖多种作战实体类型、适应复杂多变环境的新型作战体系。

3 基于Agent的作战系统智能化研究框架

基于Agent概念,可涵盖人工智能主要分支建立统一研究框架(图1)。单体Agent智能涉及感知智能、认知智能和行动智能。感知智能为Agent提供数据获取能力,是认知智能的基础。认知智能使用感知数据进行分析和决策,是行动智能的前提。行动智能实施认知智能做出的决策,将思考转化为行动。群体智能是由多个简单个体间通过协作表现出的智能行为,可与上述三种智能相结合,提高系统的整体效能。混合智能整合不同的智能类型,以实现复杂任务并适应多变环境。该研究框架有望为作战系统的一体化智能设计提供新范式。

图1 基于Agent的人工智能研究框架

3.1 感知智能

感知智能是指机器通过传感器对所处环境进行信息获取,经信息处理和理解建立环境模型来表达所处环境信息的能力。感知数据处理是情报分析和态势感知的关键组成部分。图像情报分析中,对物体目标的识别、地形图像的拼接以及人物目标的检测是目标信息获取、数据融合、目标关联、态势感知、目标引导等高层次情报分析的基础。电子战和情报收集中,语音识别技术可自动解析截获的通信内容,处理多变性信号和噪声干扰,适应不同通信环境并解析通信内容和意图,为决策提供支持,还可以依托文本处理技术产生准确、规范的文本处理产品,为情报分析提供技术支持。

3.2 认知智能

认知智能是基于感知信息及已有的经验和知识进行判断、推理、学习、规划并形成决策,类似于人类的分析、思考、理解和判断等能力。在作战系统中,知识库和推理的结合为分析复杂数据提供了有力工具,可提高决策质量、速度和适应性。问题求解可用于辅助作战决策、战场模拟、战略规划以及无人系统的任务分配和路径规划。智能规划与决策是无人机、无人车等自主系统以及模拟仿真、作战任务规划等软件系统的核心技术。机器学习通过提升数据分析效率,增强威胁评估能力,优化战场态势感知以及改进作战策略,提高作战效率、预警能力和决策精准度。

3.3 行动智能

行动智能是机器将决策转化为实际行动的能力,包括智能控制和机器人运动控制等。行动智能的实现依赖于多种控制理论技术的综合应用,利用人工智能技术提升自主性,在各种环境中进行智能响应和操作。在作战系统中,智能控制利用先进的计算方法来优化和自动化武器系统的操作,使其能够在复杂环境中执行侦察、监视、目标定位和打击任务。运动控制技术集感知、决策和行动于一体,包括单体运动控制和群体运动控制,主要应用于机器人和无人系统。

3.4 群体智能

群体智能体现在通过群体协作,聚合数量众多的单体智能,实现复杂的智能行为。多Agent有助于克服单Agent的局限性,实现多流程并行处理,提高系统运行可靠性。在作战仿真中,多Agent系统可用于模拟多方力量的交互和协作,以及网络中心战等应用场景,帮助指挥员理解和预测可能的行动结果,还可以通过将军事对抗转化为博弈问题,利用人工智能技术解决意图判断、威胁评估与指挥控制等问题,提高决策水平。

3.5 混合智能

混合智能是以生物智能和机器智能的深度融合为目标,通过连接通道,建立兼具生物的环境感知、记忆、推理、学习能力,以及机器的信息整合、搜索、计算能力的高性能智能形态。在作战系统中,人机交互技术的发展使得人能够自然、高效地与机器交流和协作,增强人机互动效率和效果。目前,无人系统在复杂动态环境下完全自主运行仍存在很大挑战,要遵循“平台无人、系统有人”的特点,通过人与无人系统之间的智能交互和协同控制,实现人在回路的环境感知、态势判断、任务规划、决策、行动等能力。

4 Agent在作战系统中的应用方式

Agent的常见应用模式包括:反思,Agent通过交互学习和反思来优化决策;工具使用,Agent通过调用多种工具来完成任务,这些工具可以是软件应用程序、算法、硬件设备或其他能帮助Agent实现其目标的资源;规划,Agent规划出一系列行动步骤来达到目标;多Agent协作,涉及多Agent之间的交互与协同。本文以此为基础,结合作战任务需求,构建基于反思的单体Agent、基于规划的作战任务规划Agent、基于仿真的平行推演Agent以及基于协作的多Agent系统等。

4.1 数字孪生的概念

现代战场上,战争“迷雾”是由于大量信息无法得到快速处理和理解造成的。Agent技术可高效处理海量数据,实现精准态势认知,为决策和行动提供依据。

以态势认知为例,单体Agent内部包含配置、记忆、认知和行动等基本模块。配置模块定义Agent的基本特征和属性,如身份、角色、能力等。记忆模块负责存储Agent的历史信息和经验,包括过去的状态、行为和环境反馈。认知模块中,Agent根据其目标、当前状态以及环境信息,形成综合认知结果。行动模块基于实时态势和预测分析,提供作战建议和优化策略。此外,Agent还可能包含通信、多传感器融合、效果评估等组件,以提高其在复杂环境中的有效性和适应性。

反思和自省对提升Agent性能具有关键作用。Agent对既往行为进行反思,从错误中学习,完善认知过程,可提高结果质量。反思过程中,系统评估当前的行为产出,比较当前输出与期望结果的差距,识别其中的问题或不足之处。在自省过程中,基于反思识别的问题,调整其态势认知过程或行为策略,必要时发展全新的策略或方法。Agent通过不断自我评估和调整,使系统能够学习并改进认知过程,更有效应对复杂问题。

4.2 基于规划的作战任务规划Agent与基于仿真的平行推演Agent

将Agent应用于作战任务规划与仿真,可对战场环境中的作战实体进行精确描述,为实际作战提供理论依据和策略支持。图2为基于Agent的作战任务规划与平行推演框架。

图2 基于Agent的作战任务规划与平行推演框架

作战任务规划Agent通过智能传感器网络获取多模态感知信息,在内部规划系统中根据给定的作战目标分解复杂任务,制定具体作战计划,基于作战决策给集群作战单元下达作战指令。智能传感器网络由大量传感器节点组成,单个节点具有环境信息采集和数据处理功能,可在调度下进行主动环境感知和通信。作战任务规划Agent专注于制定计划和提供决策支持,利用规划能力确定最佳行动方案。集群作战单元通过协作共同完成任务,为规划系统提供行动反馈。

平行推演Agent侧重于模拟不同的未来情景来优化决策,通过创建可能的未来情境来测试计划的有效性,帮助决策者理解潜在的结果和风险。平行推演Agent接收并处理实时数据,动态生成仿真实体,并根据实时数据进行修正,以适应环境变化。通过对作战计划的分析预测,提供对未来发展的深入见解,为决策提供支持。

4.3 基于协作的多Agent系统

针对联合作战等复杂任务,情报分析Agent、态势感知Agent、作战任务规划Agent、平行推演Agent以及战略支援Agent等组成了多Agent系统。多Agent系统具有以下优势:1)数量优势,每个Agent从事特定工作,结合多个Agent的技能优势和领域知识,可提高系统效率和通用性;2)质量优势,多个Agent对同一问题可能产生不同观点,Agent通过通信并结合自身知识不断更新观点,可有效减少虚假信息,提高结果可靠性。

交互是多Agent协同工作的关键,常见的交互方式有合作、竞争、协商、自组织和反馈等。不同Agent可通过角色分配和协调实现复杂任务的有效分工和执行。例如,CAMEL探索了沟通式Agent,提出“角色扮演”的社会型多Agent框架。通过观察其他Agent的行为和结果,Agent学习新的策略和行为模式,提高自身性能。负向反馈可用来抑制某些不希望出现的行为,促进系统稳定运行。系统还可以根据任务需求和环境变化,动态调整Agent之间的关系和组织结构。

战场环境中,通信可能受干扰,计算资源受限,存在对抗攻击风险,实时性要求高,对多Agent系统设计提出了高要求。研究者开发了多种分布式决策算法,如分布式马尔可夫决策过程、多Agent强化学习等,以实现通信受限环境下的协同作战。通过自组织网络技术,多Agent系统可在通信不稳定或中断时,自动调整通信结构,保持系统整体功能。设计冗余系统和自愈算法可提高系统的抗毁伤能力和自我修复能力。

4.4 基于Agent的作战系统应用举例

假定战场地形复杂、天气多变,我方作战任务是夺取敌方城市中心的指挥中心,同时保护我方关键基础设施,并最小化行动对平民及城市设施的影响。我方装备了最新的人工智能驱动的作战系统,包括无人作战飞机、精确制导武器以及高度自动化的指挥和控制系统。敌方拥有一定数量的传统武装力量,包括步兵、坦克、火炮等,主要依赖传统战术执行防御任务。

作战过程包括五个阶段。在初始阶段,侦察Agent部署装备有光学、红外、雷达等多种传感器的无人机进行全天候侦察,通过数据融合技术实现对敌方部署的实时监控。情报分析Agent利用深度学习算法分析收集到的大量数据,快速识别敌方布防漏洞,自动生成攻击建议。在计划阶段,任务规划Agent基于情报分析结果,利用优化算法评估不同攻击路径和战术的成功率,自动生成多套作战方案供指挥官选择。作战仿真Agent通过高精度战场仿真模型,模拟不同作战方案的执行效果,预测战场变量和潜在风险。在执行阶段,武器控制Agent指挥无人机群和精确制导武器,实施精准打击,同时监控打击效果,动态调整攻击策略。战斗执行Agent在无人机的支援下,迅速机动我方精锐部队,利用精确火力摧毁敌方重要目标。在调整阶段,情报分析Agent与任务规划Agent持续监控战场态势,根据实时情报调整作战计划,必要时改变攻击目标或增援。在结束阶段,所有Agent协同作战,确保完全控制敌方指挥中心,同时保护我方重要设施和平民安全。通信管理Agent采用加密通信技术,确保作战过程中的通信安全和信息传输的可靠性。

在作战系统内部,对各Agent进行统一的结构设计,为每个Agent设计标准化的输入/输出接口,确保它们能够以统一的方式接收和发送信息。Agent内包括配置、记忆、认知和行动等模块,根据不同功能允许内部处理机制的多样性。制定统一的数据格式和协议,确保在不同Agent之间交换信息的一致性,减少解析上的误差和延迟。所有Agent都遵循同一套行动协议,规定在特定情况下的行动策略和响应方式,从而保证各Agent的行为一致和可预测。考虑系统对可靠性和实时性的高要求,设计具有鲁棒性的通信结构,确保在任何Agent失效时,系统仍能保持运行。

5 基于Agent的作战系统智能化发展趋势

随着大模型和Agent技术的进步,Agent系统呈现出更复杂、更智能、更协作的发展趋势。Agent有望融合大模型的认知能力、具身智能的行动能力和群体智能的协作能力,在作战系统效能提升中发挥更大作用。

5.1 与大模型相结合提升作战Agent的自主性

大模型在语言理解、决策制定及泛化能力等方面展现出巨大潜力,为Agent突破带来了契机。一方面,大模型庞大的训练集包含了大量人类行为数据,为模拟类人交互奠定了基础;另一方面,大模型涌现出上下文学习、推理、思维链等类人思考能力,可作为Agent的“大脑”,实现复杂问题拆解。Agent允许用户进行复杂的交互和任务协调,根据给定目标自动创建合适的提示词,更好地激发大模型的推理能力。

如图3所示,基于大模型的Agent 包括规划、记忆与工具调用等模块。规划模块负责将复杂目标拆解为可执行的子任务,并动态调整执行策略,以灵活应对不确定性。任务分解过程基于思维链实现,通过明确展示解决问题的逻辑步骤,增强大模型的透明度和可解释性。工具调用模块使Agent能够利用外部工具来执行具体任务,如数据库查询、科学计算、图像处理等。工具作为使用者能力的扩展,可在专业性、事实性、可解释性等方面提供帮助。记忆模块在多轮对话中保持上下文,维护Agent的世界知识和既有经验。

图3 由大模型驱动的自主Agent系统框架

将大模型与Agent相结合,可提高作战系统的自主水平和决策速度。大语言模型在情报分析、作战规划、辅助决策等方面展现出应用潜力。2023年4月,美海军陆战队测试了“赫尔墨斯”(Hermes)大语言模型在战役级作战规划方面的能力。5月,美陆军在机密网部署生成式人工智能系统“多诺万”(Donovan),用于快速情报分析和决策支持。7月,美空军在“全球信息优势”实验中测试了5种生成式大模型,以提高获取和处理作战信息的速度。2023年7月,渊亭科技发布国内首个军事领域大模型“天机·军事”,融合知识图谱、强化学习、运筹优化等技术,服务于作战指挥、无人集群协同、策略仿真等应用场景。

基于大语言模型的Agent可用来模拟历史战争和未来冲突场景,帮助分析和预测战争的各种可能性。例如,Hua等提出基于大语言模型的多Agent系统WarAgent,模拟了多次历史国际冲突。尽管大模型无法完全再现人类行为的复杂性,但其展现了在复杂情境重现、动态假设场景模拟、外交政策决策计算等方面的潜力。

5.2 与虚实环境交互学习的作战Agent实现自主进化

近年来,元宇宙概念下的众多新技术,包括增强现实(Augmented Reality,AR)、虚拟现实(Virtual Reality,VR)、头显、3D建模及人工智能虚拟环境,在军事领域得到广泛应用。Agent可作为元宇宙中的智能助手,通过模拟实验对军事行动和武器装备性能进行预测、优化和评估,或作为虚拟世界的参与者,与人类进行交互和协作。

在沙盒模型等虚拟环境中的自由探索,为Agent学习提供了足够的交互数据和试错机会。AutoGPT、MetaGPT、CAMEL、GPT Engineer等应用实例展现出了令人瞩目的多样性和强大性能。只需要提供要扮演的角色、描述和目标,AutoGPT就能利用GPT-4和搜索等工具,自主分解任务、执行操作并完成任务。2023年5月,英伟达AI Agent Voyager接入GPT-4,通过自主编写代码,完全独霸了《我的世界》,在游戏中进行全场景的终身学习。商汤、清华等共同提出了通才AI Agent GITM,能够通过自主学习完成任务,表现优异。

Agent也展现了在物理世界中进行多模态理解和学习的能力。针对具身智能的研究关注Agent在物理世界中有效操作的能力,以及与人类在共享空间中的安全交互,主要方法是从演示或反馈中学习,让Agent在使用工具方面具备泛化能力。通过持续学习和强化学习,Agent在与环境交互中自我迭代和升级,自主规划任务、开发代码、调动工具、优化路径,从而实现目标。未来,Agent可能会自给自足地制造工具,从而提高其自主性和独立性。

5.3 作战Agent实际应用面临严格的风险评估

作战Agent应用于自主决策和人机协作等方面,这可能引发安全、伦理及法律问题,包括如何确保Agent的行为符合人类价值观,如何避免其被误用甚至滥用,如何防止泄密和保证数据安全。Agent应用风险包括:1)本体性风险,即Agent可能超出人类的控制范围;2)能动性风险,即Agent可能在没有人类指令的情况下采取行动;3)意外性风险,即系统故障可能导致的意外伤害。

Agent技术成熟度仍有待提高。通常Agent只能在特定领域内有效工作,对难以表征或迁移的角色,需要通过针对性地模型微调来提高性能。面对可能的对抗性攻击,Agent设计需要足够鲁棒,以防微小变化导致可靠性问题。作战Agent需要具有非常强的适应性和可解释性,以通过严格的测试和监管。目前,Agent性能评估缺乏统一标准,不同Agent系统间难以比较优劣。基于上述原因,Agent在作战系统中的大多数应用将增强而非取代人类的作用。

6 结束语

随着战争的复杂性、对抗性和实时性加剧,预期Agent技术将在作战系统优化中发挥关键作用。通过将Agent技术集成到作战系统的各个环节,可实现快速目标识别、威胁评估和战术执行,使军事行动更加高效和准确。随着大语言模型的发展,Agent在理解和生成自然语言方面的能力不断提升,人机协同将更加自然高效。但是,Agent在作战系统中的应用仍面临诸多困难和挑战。面对资源受限的开放环境,Agent的数据分析和推理是不充分的。需要引入先验知识并使用验证工具,弥补数据统计分析的不足。同时,需要在技术、道德、法律等方面对Agent系统进行协调和管控,以保证其在军事领域的应用安全、可靠、合法、有效。

END

| 作者：刘伟, 谢海斌, 陈少飞

| 责编：胡前进

| 审核：张培培

本文来源：指挥控制与仿真

原文链接：https://mp.weixin.qq.com/s/VW7QmrkEVMNUSrwPBu7Cig

关注公众号了解更多

会员申请请在公众号内回复“个人会员”或“单位会员

欢迎关注中国指挥与控制学会媒体矩阵

CICC官方抖音

CICC头条号

CICC微博号

CICC官方网站

CICC官方微信公众号

《指挥与控制学报》官网

国际无人系统大会官网

中国指挥控制大会官网

全国兵棋推演大赛

全国空中智能博弈大赛

搜狐号

一点号

中国指挥与控制学会

中国指挥与控制学会是中国科协、国家民政部批准成立的国家一级学会，是由我国从事指挥与控制科学技术领域的单位和科技工作者自愿结成的学术性、全国性社团组织。学会办事机构挂靠中国兵器工业集团公司。