LLM首次太空部署,对星图测控航天仿真设计有何影响?

科技   2024-10-31 20:21   北京  

2024年8月Booz Allen Hamilton 宣布成功在国际空间站上部署并运行了一个生成式AI大语言模型(LLM,Large Language Model)。这个模型被认为是首个在太空中部署的LLM,堪称是人工智能领域的一次重大突破。
大型语言模型(LLM)是专门设计用于理解和生成人类语言的人工智能模型。通常情况下,LLM指的是那些拥有数百亿甚至更多参数的语言模型,它们通过对海量文本数据进行训练,获得对语言的深层次理解。而航天仿真推演系统通过模拟完整的推演场景,通过各方的航天模型控制系统、场景控制系统结合空间环境和模型信息等要素,深入分析在真实环境中这些模型的相互作用和影响。

那么,LLM具备哪些能力?它又是如何与航天仿真推演系统相结合的呢?


LLM的能力

1

涌现能力

区分大语言模型(LLM)与以前的预训练语言模型(PLM)最显著的特征之一是它们的涌现能力。与航天仿真推演系统相适配的典型涌现能力主要有以下三点:


上下文学习能力

由GPT-3首次引入,这种能力允许语言模型在提供自然语言指令或多个任务示例的情况下,通过理解上下文并生成相应输出的方式来执行任务,而无需额外的训练或参数更新。该能力可使航天仿真推演系统进行任务筹划时具备快速响应能力。


指令遵循能力

通过使用自然语言描述的多任务数据,可对指令进行微调,LLM被证明在使用指令形式化描述未见过的任务上表现良好。这意味着LLM能够对航天仿真推演系统中新场景和新仿真任务能够生成任务指令并执行,而无需事先进行场景预置,展示了其强大的泛化能力。


逐步推理能力

LLM通过采用思维链(CoT, Chain of Thought)推理策略,利用包含中间推理步骤的提示机制来解决某些复杂任务,从而筹划出可执行的任务指令信息。


这些涌现能力使得引入了LLM的航天仿真推演系统在指挥控制层面具备智能筹划和指令生成的能力,又同时在同样的场景下可以产生多样性的筹划结果,使得推演任务的各参与方要随时准备应对计划外的情况,打破用户的思维局限,拓宽各方对任务分析筹划的视角。

2

作为基座模型支持多元应用的能力

在2021年,斯坦福大学等多所高校的研究人员提出了基座模型(foundation model)的概念,清晰了预训练模型的作用。这是一种全新的AI技术范式,借助于海量无标注数据的训练,获得可以适用于大量下游任务的大模型(单模态或者多模态)。这样,航天仿真推演系统的多个应用可以只依赖于一个或少数几个大模型进行统一建设,可以极大地提高研发效率,节省项目实施成本。

3

支持对话作为统一入口的能

大型语言模型的出现再次让聊天机器人这种交互模式可以重新涌现,而集成了LLM的航天仿真推演系统,具备让用户通过对话方式进行仿真推演,使用引导式对话方式提供任务信息,LLM可以快速生成任务筹划结果和方案评估结果给用户参考,无需繁杂的界面操作会让用户对系统的使用有更多的期待。


 LLM在航天仿真推演系统的应用

航天仿真推演系统主要是解决实际航天业务场景中演练时间长、成本高、不确定性因素多的问题,通过构建仿真系统可以更好地帮助用户了解航天业务体系的能力构建,为决策和研发提供重要的参考依据。而近些年LLM的发展,也为航天仿真推演系统带来了更强大的能力支撑。

1

LLM应用开发

开发大模型相关应用,其技术核心点虽然在大语言模型上,但一般通过调用API或开源模型来实现核心的理解与生成,通过引导指令(Prompt Enginnering)来实现大语言模型的控制。在大模型开发中,一般不会去大幅度改动模型,而是将大模型作为一个调用工具,通过引导指令、业务数据、业务逻辑分解等手段来充分发挥大模型能力,适配应用任务,而不会将精力聚焦在优化模型本身上。大模型开发的流程如下:

用引导指令来替代子模型的训练调优,通过提示链路组合来实现业务逻辑,用一个通用大模型+若干业务提示指令来解决任务,从而将传统的模型训练调优转变成了更简单、轻松、低成本的提示指令设计调优。从实际业务需求出发构造小批量验证集,设计合理提示指令来满足验证集效果。然后,将不断从业务逻辑中收集当下提示指令的Bad Case,并将Bad Case加入到验证集中,针对性优化提示指令,最后实现较好的泛化效果。

2

LLM与航天仿真推演系统的结合

航天仿真推演系统主要由三层构成,LLM属于其综合服务层的业务支持服务部分,系统构成图如下:

目前LLM服务可以在行动分析、行动控制和效果评估等方面提供核心的业务支持。


行动分析方向

通过构建大量的简单任务提示指令,结合当前任务给出引导指令,推理出可适配当前任务的行动方案,完成指挥控制的方案筹划工作。


行动控制方向

针对不同的装备能力,选择适当的优化策略,在训练数据中对提示指令进行优化,在适配筹划的方案时可以通过梯度下降方法调整提示指令的权重,或者通过生成和筛选多个提示指令进行优选,使LLM依据筹划的方案提供适配的装备并赋予可执行的行动参数。


效果评估方向

通过使用Prompt-Tuning方法,指导模型生成任务信息汇总摘要类型的航天仿真模型推演效果评估文本,提高语言模型生成文本的准确性和一致性,并且能够更好地适用于各种任务。


这些涌现能力使得引入了LLM的航天仿真推演系统在指挥控制层面具备智能筹划和指令生成的能力,又同时在同样的场景下可以产生多样性的筹划结果,使得推演任务的各参与方要随时准备应对计划外的情况,打破用户的思维局限,拓宽各方对任务分析筹划的视角。

3

LLM的应用缺陷


人工校验

目前LLM最大的缺陷是经常会生成无中生有的方案,需要进行人工二次校验,但是这对于航天仿真推演系统来说可能并不算是坏事。比如作为阵营A用户其自动筹划阵营B的行动方案,生成的那些无中生有的方案阵营B的航天模型又具备相应的执行能力,对A用户来说可能是意料之外的难题,为航天仿真推演带来了更多的可能性,这种模拟可以帮助用户制定更加科学合理的战略规划,为现实环境中的不确定性因素提供更多的预案。


业务指令识别需优化

在航天仿真推演系统中LLM的应用依赖于构建的大量不同类别的业务提示指令,针对特定场景的特定推演需求适应性较差,适合于抽象层面的任务筹划和行动规划,对于方案的正确性和行动的合理性需要做对应的引导指令且需要具备较高业务能力的用户做指令甄别,因此LLM想在航天仿真推演系统中有更好的应用还需要不断迭代优化。


星图测控致力于LLM的应用

星图测控作为专业从事数字太空科技服务的商业航天企业,成立数字太空研究院致力于探索前沿科技在数字太空领域的应用落地,现阶段在从三个方面推动LLM优化迭代:

1

跨技术综合应用

对LLM的研究正逐渐从单一技术的应用向跨技术综合应用转变,通过对数据挖掘、自然语言处理、机器学习等技术的有机结合,将进一步提升LLM在处理复杂任务时的能力和效率。

2

多模态学习

LLM除了文本处理外,通过将自然语言处理与计算机视觉、语音识别等技术相结合,能够对图像、音频等多模态数据进行处理和应用。

3

隐私保护

针对特种领域数据安全尤为关键,通过算法优化和数据加密等手段,确保模型在提供优质服务的同时,保护用户的隐私和数据安全。


LLM作为人工智能领域的重要成果,正在不断推动着自然语言处理技术的发展和应用,星图测控通过对LLM的不断优化迭代,利用LLM的数据处理、智能分析、语音识别、智能应答等能力推动航天仿真系统任务分析筹划、任务行动规划、行动效果评估、智能指挥控制等多个业务领域的应用与发展。



星图测控简介

中科星图测控技术股份有限公司成立于2016年,股票代码:874016,是中科星图股份有限公司(股票代码:688568)的控股子公司,是专业从事数字太空科技服务的商业航天企业,致力于以数字化手段提升、增强和拓展卫星、火箭等实体进出空间、探索空间、利用空间、开发空间的能力与效益。公司利用空间科学及新一代信息技术,研发并推出了以洞察者平台为核心的数字太空系列产品,面向特种领域、民用领域、商业领域提供航天测控管理、航天数字仿真相关的产品销售、技术开发及服务。








推荐阅读



推荐活动


中科星图
公司以数字地球为核心,将AI、大数据、云计算等新一代信息技术与商业航天、低空经济产业深度结合,形成了集数据、计算和应用于一体的空天信息服务体系
 最新文章