大模型在太空任务的应用探索

科技   2024-08-19 13:50   新加坡  

随着科技的不断进步,人工智能(AI)在各个领域的应用日益广泛,而太空探索领域也迎来了其革命性的应用——生成性人工智能(GenAI)。

搜集了一些国外的生成式AI/大模型在太空领域的有关实际应用,来看看行业内是什么落地方向。

GenAI在太空的四大优势

  • 自然语言处理(NLP)
    宇航员可以通过直观易用的语言界面,访问和分析太空操作和实验产生的数据。

  • 减少数据传输/延迟问题
    初步处理和分析在太空船上完成,只需将结果传输回地球,大大减少了数据传输量和延迟。

  • 实时决策
    宇航员可以更快地获取实验和其他分析的发现,地球利益相关者也能更快地访问卫星传感器数据分析和其他发现,这在紧急情况或时间敏感的情况下至关重要。

  • 自适应模型
    LLM可以根据变化的条件和工作要求进行更新和上传,以反映最新的太空环境。

首个国际空间站上的LLM应用

Booz Allen Hamilton公司在国际空间站(ISS)上部署了一个LLM应用。自2024年7月中旬以来,该应用作为一项实验的一部分,旨在测试在太空船资源受限的计算环境中使用GenAI应用的可行性。这也是首次在太空中实际部署LLM。

国际空间站上的HPE机载计算机,图源NASA

Booz Allen与Hewlett Packard Enterprise(HPE)合作,在八周内开发了这款应用。它被成功上传到ISS,作为概念验证(POC)实验的一部分,旨在帮助宇航员在不依赖地球互联网的情况下,使用GenAI进行实验室实验。
主要功能包括提供远程数据获取和检索增强生成(RAG),使宇航员能够有效地访问信息,并使用自然语言查询准确解释和解决复杂问题。

Φsat-2:ESA的AI小卫星

欧航局(ESA)的 Φsat-2是一款立方星,旨在展示AI技术如何优化从太空对地球的观测。


Φsat-2将携带六款AI应用,分别是

  • 多光谱成像工具和系统

  • 图像去云

  • 海上船只检测和分类

  • 根据卫星影像实时生成地图

  • 发现海洋生态系统中的异常以及检测野火等

  • 星上图像压缩及重建工具

Φsat-2集成展示

特别引人注目的是*Sat2Map*应用,它使用CycleGAN将卫星图像转换为电子地图,实现近实时地图数据的生成和交付。CycleGAN是一种GenAI,属于无监督图像到图像翻译模型的范畴。通过学习两个领域之间的映射,CycleGAN促进了不同图像风格或领域的创造性转换。

图像到图像的翻译涉及将一个领域的输入图像(例如照片)转换为另一个领域的输出图像(例如绘画、地图)。这种实时制图能力对于紧急服务尤为重要(例如,在地震或洪水等灾难期间能够快速识别仍然可通行的道路)。

ESA计划首先在东南亚测试Sat2Map应用,以展示其在危机管理中的潜力。Φsat-2项目是ESA与由Open Cosmos领导的联合体合作的成果,包括Ubotica、CGI、CEiiA、GEO-K、KP Labs和SIMERA。

一些想法

GenAI在太空领域需要先进的AI边缘计算能力搭配使用,虽然仍处于实验阶段,但Booz Allen Hamilton和ESA的应用寻求展示将GenAI能力直接集成到机上/星上的可能性,通过促进基于自然语言的数据检索和分析、提高数据传输效率和实时决策。

国内有关大模型在星上的应用仍未有公开宣发;但谈及大模型势必要说到算力,先解决端侧算力问题,再论证端侧的大模型应用。

国内关于星上/机载侧的计算,其实已经有了不少案例。

  • 据公开报道,早在2021年,国内卫星厂商就已实现了端侧计算,完成星上去云处理:

“天算星座”计划,由北京邮电大学深圳研究生院与天仪研究院共同发起,以服务国家重大战略需求和国际科技前沿探索为目标,通过对卫星智能化、服务化、开放化设计,构建产学研用一体化的空天计算在轨试验开放开源平台,将边缘计算与卫星计算平台融合,使得卫星在太空中可同时调用边缘和中心云的资源并具备AI能力和多任务处理能力。测试数据表明,通过卫星与地面站协同推理,计算精度提升了50%以上,卫星回传数据量可减少90%,卫星将进入云原生时代。

  • 国内目前也有比较头部的公司专门从事星上的边缘计算技术研发,如北京星测未来,参与了多个卫星研发,产品成熟度较好。

星载AI计算板卡具备275TOPS超高算力,实现在轨卫星最高算力水平,可为超高分光学星、SAR卫星等高通量数据的在轨实时处理提供强大支持,图源-星测未来公众号

可以看到,通过端侧给大模型提供算力支撑,目前已有自主解决手段,下一步就是做好试点研究和验证。后续要做的大致包含如下任务:

论证大模型应用场景: 结合AI Agent理念,在卫星网络安全、碰撞保护、图像实时解译及告警等相关领域选取一些重要价值场景
硬件适配:优选合适的大模型,如有可能还涉及多模态大模型,由硬件厂商主导完成大模型的端侧适配
模型训练:针对目标大模型,按照场景任务进行专门的微调、训练等工作,比如完成一个“星上情报分析大模型”
智能体构建:针对场景需求,构建一个完整星上AI agent,用于流程化处理各类任务,如“星上威胁处理大模型”

当然,在素来注重稳定运行的航天领域,大模型技术似乎还是不那么严谨,比如幻觉问题;还是应当经过充分的技术研发,完善各种安全保证措施后,才可允许其真正上天运行。

后续还会继续写文,就大模型在商业航天的领域做一些思考。

欢迎交流

笔者长期从事人工智能、遥感、大模型等业务

欢迎添加微信交流


空天感知
专注商业航天、人工智能、气象水文等交叉学科,精选行业资讯,深耕AI业务落地
 最新文章