本文发表于《指挥控制与仿真》2024年第6期
刘伟, 谢海斌, 陈少飞. Agent视域下的人工智能赋能作战系统[J]. 指挥控制与仿真. 2024, 46(6): 8-14.
摘要:针对作战系统的智能化设计问题,提出了基于Agent的人工智能技术概念框架和应用方法。首先,阐述了Agent概念,讨论了在作战系统中研究Agent的重要意义。然后,介绍了基于Agent的人工智能研究框架,列举了Agent在作战系统中的多种应用方式。最后,分析了Agent技术发展趋势及其作战应用可能面临的风险与挑战。
1 Agent概念与内涵
1.1 Agent基本概念
一般认为,Agent是能够通过传感器感知环境,并且通过执行器对环境产生影响的任何事物。Agent概念具有强包容性,能够将所有对环境进行感知和施加影响的个体包容到统一的框架下研究,无论是生命体还是人造物。作战系统涉及多样化的平台和要素,如人类战士、无人作战装备、智能软件等,它们都可以被囊括到Agent范畴内进行设计和分析。
多Agent系统由多个Agent组成,通过交互来解决超出个体能力或知识范围的问题。现代战争涉及多域作战,需要多兵种协同、有人与无人协同、实体与虚拟空间作战能力相结合。多Agent系统为研究解决作战行动中的分布式问题提供了概念框架,可基于Agent交互实现分布异构实体间的有效组织、通信和协作。
1.2 研究Agent的意义
2 基于Agent的建模方法研究现状
基于Agent的建模是目前解决作战复杂适应系统建模仿真最有效的方法之一。作战Agent是各类作战实体(层次、粒度可能不同)在仿真系统中的映射,也是基于Agent建模仿真的核心要素。Agent体系结构是从规约到实现这一中间步骤的表示,涉及系统结构选择和框架设计、模块分解与关系确定以及感知与行动机制建模等多个方面。
随着基于Agent的建模方法在实际建模仿真中的应用,面向Agent的软件工程概念应运而生,先后提出了基于知识工程的方法、基于对象技术的方法、基于角色和组织模型的方法等面向Agent的软件工程方法学。但是,在实际应用中发现,计算机仿真工程技术人员建立的仿真模型与军事人员建立的军事概念模型之间往往存在不一致性,需要经过反复的迭代修正,才能满足军事需求。因此,研究人员提出了用军事概念模型直接驱动多Agent作战仿真模型的建模方法,在保证仿真可信性的前提下,提高工程开发效率。
研究战争这类复杂系统对于动态环境的适应性,需要借助基于多Agent建模仿真方法。基于多Agent作战建模仿真是利用Agent对作战复杂系统中各个实体构建模型,通过对作战Agent个体及相互之间(包括与作战环境)的行为刻画,描述作战复杂系统的宏观行为。相对于传统面向过程和面向对象的仿真技术,基于多Agent仿真方法对复杂系统的行为具有更强的建模与仿真能力、更高的抽象性和表达能力、更强的仿真动态性和灵活性,实现了微观行为和宏观行为的有机结合,是研究作战复杂系统的重要手段。
在多Agent仿真中,人们重视Agent适应性对作战仿真过程及其结果的影响,取得了丰硕的研究成果。如王步云等梳理了遗传算法、强化学习、神经网络等方法在实现作战Agent适应性方面的成果;石鼎等从均衡决策的角度提出强化学习驱动的多Agent协同作战仿真算法。但是现有的研究往往只实现某一方Agent的适应性,作为对抗中的另一方仍然采用固定规则的决策模式。在仿真中如何实现红蓝双方的同时学习、学习过程是否能够收敛、对作战仿真结果有何影响,都是有待深入研究的问题。由于作战任务更加复杂,作战系统组成更加多样,有必要研究构建能够涵盖多种作战实体类型、适应复杂多变环境的新型作战体系。
3 基于Agent的作战系统智能化研究框架
基于Agent概念,可涵盖人工智能主要分支建立统一研究框架(
图1 基于Agent的人工智能研究框架
3.1 感知智能
感知智能是指机器通过传感器对所处环境进行信息获取,经信息处理和理解建立环境模型来表达所处环境信息的能力。感知数据处理是情报分析和态势感知的关键组成部分。图像情报分析中,对物体目标的识别、地形图像的拼接以及人物目标的检测是目标信息获取、数据融合、目标关联、态势感知、目标引导等高层次情报分析的基础。电子战和情报收集中,语音识别技术可自动解析截获的通信内容,处理多变性信号和噪声干扰,适应不同通信环境并解析通信内容和意图,为决策提供支持,还可以依托文本处理技术产生准确、规范的文本处理产品,为情报分析提供技术支持。
3.2 认知智能
认知智能是基于感知信息及已有的经验和知识进行判断、推理、学习、规划并形成决策,类似于人类的分析、思考、理解和判断等能力。在作战系统中,知识库和推理的结合为分析复杂数据提供了有力工具,可提高决策质量、速度和适应性。问题求解可用于辅助作战决策、战场模拟、战略规划以及无人系统的任务分配和路径规划。智能规划与决策是无人机、无人车等自主系统以及模拟仿真、作战任务规划等软件系统的核心技术。机器学习通过提升数据分析效率,增强威胁评估能力,优化战场态势感知以及改进作战策略,提高作战效率、预警能力和决策精准度。
3.3 行动智能
行动智能是机器将决策转化为实际行动的能力,包括智能控制和机器人运动控制等。行动智能的实现依赖于多种控制理论技术的综合应用,利用人工智能技术提升自主性,在各种环境中进行智能响应和操作。在作战系统中,智能控制利用先进的计算方法来优化和自动化武器系统的操作,使其能够在复杂环境中执行侦察、监视、目标定位和打击任务。运动控制技术集感知、决策和行动于一体,包括单体运动控制和群体运动控制,主要应用于机器人和无人系统。
3.4 群体智能
群体智能体现在通过群体协作,聚合数量众多的单体智能,实现复杂的智能行为。多Agent有助于克服单Agent的局限性,实现多流程并行处理,提高系统运行可靠性。在作战仿真中,多Agent系统可用于模拟多方力量的交互和协作,以及网络中心战等应用场景,帮助指挥员理解和预测可能的行动结果,还可以通过将军事对抗转化为博弈问题,利用人工智能技术解决意图判断、威胁评估与指挥控制等问题,提高决策水平。
3.5 混合智能
混合智能是以生物智能和机器智能的深度融合为目标,通过连接通道,建立兼具生物的环境感知、记忆、推理、学习能力,以及机器的信息整合、搜索、计算能力的高性能智能形态。在作战系统中,人机交互技术的发展使得人能够自然、高效地与机器交流和协作,增强人机互动效率和效果。目前,无人系统在复杂动态环境下完全自主运行仍存在很大挑战,要遵循“平台无人、系统有人”的特点,通过人与无人系统之间的智能交互和协同控制,实现人在回路的环境感知、态势判断、任务规划、决策、行动等能力。
4 Agent在作战系统中的应用方式
Agent的常见应用模式包括:反思,Agent通过交互学习和反思来优化决策;工具使用,Agent通过调用多种工具来完成任务,这些工具可以是软件应用程序、算法、硬件设备或其他能帮助Agent实现其目标的资源;规划,Agent规划出一系列行动步骤来达到目标;多Agent协作,涉及多Agent之间的交互与协同。本文以此为基础,结合作战任务需求,构建基于反思的单体Agent、基于规划的作战任务规划Agent、基于仿真的平行推演Agent以及基于协作的多Agent系统等。
4.1 数字孪生的概念
现代战场上,战争“迷雾”是由于大量信息无法得到快速处理和理解造成的。Agent技术可高效处理海量数据,实现精准态势认知,为决策和行动提供依据。
以态势认知为例,单体Agent内部包含配置、记忆、认知和行动等基本模块。配置模块定义Agent的基本特征和属性,如身份、角色、能力等。记忆模块负责存储Agent的历史信息和经验,包括过去的状态、行为和环境反馈。认知模块中,Agent根据其目标、当前状态以及环境信息,形成综合认知结果。行动模块基于实时态势和预测分析,提供作战建议和优化策略。此外,Agent还可能包含通信、多传感器融合、效果评估等组件,以提高其在复杂环境中的有效性和适应性。
反思和自省对提升Agent性能具有关键作用。Agent对既往行为进行反思,从错误中学习,完善认知过程,可提高结果质量。反思过程中,系统评估当前的行为产出,比较当前输出与期望结果的差距,识别其中的问题或不足之处。在自省过程中,基于反思识别的问题,调整其态势认知过程或行为策略,必要时发展全新的策略或方法。Agent通过不断自我评估和调整,使系统能够学习并改进认知过程,更有效应对复杂问题。
4.2 基于规划的作战任务规划Agent与基于仿真的平行推演Agent
将Agent应用于作战任务规划与仿真,可对战场环境中的作战实体进行精确描述,为实际作战提供理论依据和策略支持。
图2 基于Agent的作战任务规划与平行推演框架
4.3 基于协作的多Agent系统
针对联合作战等复杂任务,情报分析Agent、态势感知Agent、作战任务规划Agent、平行推演Agent以及战略支援Agent等组成了多Agent系统。多Agent系统具有以下优势:1)数量优势,每个Agent从事特定工作,结合多个Agent的技能优势和领域知识,可提高系统效率和通用性;2)质量优势,多个Agent对同一问题可能产生不同观点,Agent通过通信并结合自身知识不断更新观点,可有效减少虚假信息,提高结果可靠性。
交互是多Agent协同工作的关键,常见的交互方式有合作、竞争、协商、自组织和反馈等。不同Agent可通过角色分配和协调实现复杂任务的有效分工和执行。例如,CAMEL探索了沟通式Agent,提出“角色扮演”的社会型多Agent框架。通过观察其他Agent的行为和结果,Agent学习新的策略和行为模式,提高自身性能。负向反馈可用来抑制某些不希望出现的行为,促进系统稳定运行。系统还可以根据任务需求和环境变化,动态调整Agent之间的关系和组织结构。
战场环境中,通信可能受干扰,计算资源受限,存在对抗攻击风险,实时性要求高,对多Agent系统设计提出了高要求。研究者开发了多种分布式决策算法,如分布式马尔可夫决策过程、多Agent强化学习等,以实现通信受限环境下的协同作战。通过自组织网络技术,多Agent系统可在通信不稳定或中断时,自动调整通信结构,保持系统整体功能。设计冗余系统和自愈算法可提高系统的抗毁伤能力和自我修复能力。
4.4 基于Agent的作战系统应用举例
假定战场地形复杂、天气多变,我方作战任务是夺取敌方城市中心的指挥中心,同时保护我方关键基础设施,并最小化行动对平民及城市设施的影响。我方装备了最新的人工智能驱动的作战系统,包括无人作战飞机、精确制导武器以及高度自动化的指挥和控制系统。敌方拥有一定数量的传统武装力量,包括步兵、坦克、火炮等,主要依赖传统战术执行防御任务。
作战过程包括五个阶段。在初始阶段,侦察Agent部署装备有光学、红外、雷达等多种传感器的无人机进行全天候侦察,通过数据融合技术实现对敌方部署的实时监控。情报分析Agent利用深度学习算法分析收集到的大量数据,快速识别敌方布防漏洞,自动生成攻击建议。在计划阶段,任务规划Agent基于情报分析结果,利用优化算法评估不同攻击路径和战术的成功率,自动生成多套作战方案供指挥官选择。作战仿真Agent通过高精度战场仿真模型,模拟不同作战方案的执行效果,预测战场变量和潜在风险。在执行阶段,武器控制Agent指挥无人机群和精确制导武器,实施精准打击,同时监控打击效果,动态调整攻击策略。战斗执行Agent在无人机的支援下,迅速机动我方精锐部队,利用精确火力摧毁敌方重要目标。在调整阶段,情报分析Agent与任务规划Agent持续监控战场态势,根据实时情报调整作战计划,必要时改变攻击目标或增援。在结束阶段,所有Agent协同作战,确保完全控制敌方指挥中心,同时保护我方重要设施和平民安全。通信管理Agent采用加密通信技术,确保作战过程中的通信安全和信息传输的可靠性。
在作战系统内部,对各Agent进行统一的结构设计,为每个Agent设计标准化的输入/输出接口,确保它们能够以统一的方式接收和发送信息。Agent内包括配置、记忆、认知和行动等模块,根据不同功能允许内部处理机制的多样性。制定统一的数据格式和协议,确保在不同Agent之间交换信息的一致性,减少解析上的误差和延迟。所有Agent都遵循同一套行动协议,规定在特定情况下的行动策略和响应方式,从而保证各Agent的行为一致和可预测。考虑系统对可靠性和实时性的高要求,设计具有鲁棒性的通信结构,确保在任何Agent失效时,系统仍能保持运行。
5 基于Agent的作战系统智能化发展趋势
随着大模型和Agent技术的进步,Agent系统呈现出更复杂、更智能、更协作的发展趋势。Agent有望融合大模型的认知能力、具身智能的行动能力和群体智能的协作能力,在作战系统效能提升中发挥更大作用。
5.1 与大模型相结合提升作战Agent的自主性
图3 由大模型驱动的自主Agent系统框架
5.2 与虚实环境交互学习的作战Agent实现自主进化
5.3 作战Agent实际应用面临严格的风险评估
作战Agent应用于自主决策和人机协作等方面,这可能引发安全、伦理及法律问题,包括如何确保Agent的行为符合人类价值观,如何避免其被误用甚至滥用,如何防止泄密和保证数据安全。Agent应用风险包括:1)本体性风险,即Agent可能超出人类的控制范围;2)能动性风险,即Agent可能在没有人类指令的情况下采取行动;3)意外性风险,即系统故障可能导致的意外伤害。
Agent技术成熟度仍有待提高。通常Agent只能在特定领域内有效工作,对难以表征或迁移的角色,需要通过针对性地模型微调来提高性能。面对可能的对抗性攻击,Agent设计需要足够鲁棒,以防微小变化导致可靠性问题。作战Agent需要具有非常强的适应性和可解释性,以通过严格的测试和监管。目前,Agent性能评估缺乏统一标准,不同Agent系统间难以比较优劣。基于上述原因,Agent在作战系统中的大多数应用将增强而非取代人类的作用。
6 结束语
随着战争的复杂性、对抗性和实时性加剧,预期Agent技术将在作战系统优化中发挥关键作用。通过将Agent技术集成到作战系统的各个环节,可实现快速目标识别、威胁评估和战术执行,使军事行动更加高效和准确。随着大语言模型的发展,Agent在理解和生成自然语言方面的能力不断提升,人机协同将更加自然高效。但是,Agent在作战系统中的应用仍面临诸多困难和挑战。面对资源受限的开放环境,Agent的数据分析和推理是不充分的。需要引入先验知识并使用验证工具,弥补数据统计分析的不足。同时,需要在技术、道德、法律等方面对Agent系统进行协调和管控,以保证其在军事领域的应用安全、可靠、合法、有效。
END
关注公众号了解更多
会员申请 请在公众号内回复“个人会员”或“单位会员
欢迎关注中国指挥与控制学会媒体矩阵
CICC官方抖音
CICC头条号
CICC微博号
CICC官方网站
CICC官方微信公众号
《指挥与控制学报》官网
国际无人系统大会官网
中国指挥控制大会官网
全国兵棋推演大赛
全国空中智能博弈大赛
搜狐号
一点号