首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

研究速递 | TEOChat：首个专为遥感时序分析设计的多模态大模型

科技 2024-11-13 10:17 陕西

近日，来自Stanford的Ermon小组推出了一款创新的多模态语言和视觉助手——TEOChat。

它专门用于分析和对话基于时序地球观测（EO）数据，展示了在多种复杂任务上的卓越性能，成为遥感时序任务领域的首个大模型应用。

笔者本人也体验了这个模型，发现很有意思，可以解决之前很多复杂的业务需求。推荐你也赶快尝试下！

解决什么问题

现有VLMs缺乏处理时间序列地球观测数据的能力
需要大规模的多模态指令数据集来训练模型
需要在单张图像和时间序列数据上都能表现良好的模型架构

TEOChatlas：全新的时间序列遥感数据集

这个项目的核心技术之一，是一个庞大的指令跟随数据集——TEOChatlas，包含50多万个示例。Ermon团队对这种超大规模训练数据的重视让人印象深刻，毕竟如果没有足够多样化的数据，这类大模型的实际表现往往会大打折扣。

TEOChat：首个遥感时序任务视觉语言模型

模型架构

TEOChat采用了LLaVA-1.5架构，包括一个时间共享的图像编码器（CLIP ViT-L/14）、一个2层MLP和一个LLM解码器（Llama 2）。图像编码器用于获取序列中每张图像的表示，MLP将视觉表示投影到LLM的输入，LLM解码器生成响应。

训练策略

为了保留预训练图像编码器和LLM的强大能力，同时最小化训练期间的内存使用，研究团队冻结了视觉编码器和投影器的权重，并使用Low-Rank Adaptation（LoRA）对LLM进行微调。

此外，还使用了8位量化来减少LLM权重的内存占用。

模型评估

时间场景分类：在fMoW RGB和Sentinel验证集上，TEOChat分别取得了75.1%和45.5%的准确率，显著优于Video-LLaVA（16.6%）和GeoChat（59.2%）。

变化检测和空间参考表达：在所有变化检测任务中，TEOChat均显著优于Video-LLaVA和GeoChat。例如，在NBD建筑损坏分类任务中，TEOChat的F1值为50.0%，而Video-LLaVA仅为8.3%。

变化问答和基于区域的变化问答：在问答任务中，TEOChat在所有任务中的表现均优于基线VLMs。例如，在NBD变化问答任务中，TEOChat的准确率为89.9%，而GeoChat仅为34.0%。

时间参考表达和基于区域的时间问答：在时间参考表达和基于区域的时间问答任务中，TEOChat的准确率分别为74.9%和71.7%，显著高于Video-LLaVA（1.9%和26.5%）。

上手体验

作者在Huginnface上提供了一个demo可以用于简单验证。

我也进行了一些尝试。如下图

给定Bounding Box，问是什么

输出地物的Bounding Box

以及还有给定多个影像输入，要求完成时许分析任务的：

写在最后

TEOChat在包括时序变化检测和时序问答等任务上均表现出色。某些情况下，TEOChat不仅超越了许多专用模型，甚至在一些测试中超越了GPT-4o和Gemini-1.5 Pro等商用大模型。

能在非时序的单图像任务中，TEOChat同样展现出强大的场景分类和视觉问答能力，使其适用于更广泛的地球观测场景。

TEOChat作为时序地球观测领域的开创性工具，为遥感分析和环境监测提供了便捷的多模态解决方案。

利用这个模型，你也可以快速构建一个遥感时序分析任务的AI应用，做一些解决实际业务问题的场景化应用。

项目地址：https://github.com/ermongroup/TEOChat

arxiv地址：https://arxiv.org/abs/2410.06234

往期推荐：

发展商业航天，要先让下游遥感产业赚钱

听声测雨新手段，将万千摄像头化身成为雨量计

ChatGPT接入Mapbox，AI地图搜索分析的实现思考

高效跟进研究前沿，AI论文阅读工具全攻略

可开放获取高分遥感数据集汇总

Google 发布遥感大模型技术“Embedding Field”，从高维数据到真实世界的重构

欢迎交流

笔者长期从事人工智能、遥感、大模型等业务

欢迎添加微信交流

http://mp.weixin.qq.com/s?__biz=MzI2MDIyOTMyOA==&mid=2247486444&idx=1&sn=47f19ad3273aba6cf7e5a10cd571f9c7

专注商业航天、人工智能、气象水文等交叉学科，精选行业资讯，深耕AI业务落地

最新文章

洛马公司全新中型卫星平台LM 400将迎来首飞

NASA与微软联合推出“Earth Copilot”，“智能助手“或成为行业产品标配

看水利部水利遥感星座战略布局，机遇与挑战并存

研究速递 | TEOChat：首个专为遥感时序分析设计的多模态大模型

NASA多源遥感数据联合监测飓风"海伦"引发的洪涝灾害

我国成功发射“西光壹号”系列卫星，国内首颗高分辨率点源甲烷监测商业卫星开始“服役”

美国再现大型星座计划：前谷歌高管欲打造3960颗抗干扰通信卫星网络

ChatGPT接入Mapbox，AI地图搜索分析的实现思考

正射校正到底在修正哪些地图误差

卫星见证：撒哈拉沙漠中的神秘湖泊重现

ChatGPT、Python和OpenCV支持下的空天地遥感数据识别与计算——从0基础到15个案例实战

卫星如何看清隐形的熔岩流和活跃的野火

高效跟进研究前沿，AI论文阅读工具全攻略

AI如何帮助卫星从太空追踪“隐形船只”

可开放获取高分遥感数据集汇总

美国卫星通信公司IntelSat遭遇重大卫星故障，服务受到影响

研究揭示遥感领域人工智能高度易受攻击

美国商务部放宽商业航天技术出口管制

EDA收购Descartes Labs：遥感领域行业整合缩影

美国国家侦察局（NRO）加速卫星数据处理与共享

会议预告 | 2024年陆地遥感产品前沿动态及数据使用学习大会

Google 发布遥感大模型技术“Embedding Field”，从高维数据到真实世界的重构

SpaceX成功捕获返回的星舰助推器，实现历史性突破

欧空局发布2040对地观测新战略，助力全球可持续发展

听声测雨新手段，将万千摄像头化身成为雨量计

24年Q3全球轨道火箭发射小结：首次出现同比下降

美国智库显示中国公司领先全球商业遥感，但结果需审慎看待

给雷达影像上色，SAR彩色化技术为影像增添新维度

为何遥感是深度学习图像处理的一个独特领域

全球海平面上升，卫星视角下的未来风险

商业航天速递 | Planet发布森林碳监测产品；FAA与SpaceX再起纷争；Viasat获得美国空军相控阵天线合同

Google支撑新型星座建设，助力全球野火防控新突破

Planet商业部分收入增长放缓，遥感toB难以突围

EOWater: 开源高效的水体面积遥感计算工具，基于Sentinel-2和Landsat数据

从像素到语义，快速实现遥感影像AI搜索

哨兵-2C卫星首秀，第一批回传影像效果绝佳

让卫星图像更清晰，超分辨率技术的广泛应用

地球映画：七个你可能不知道的绝美海滩

商业航天速递 | 蓝箭航天成功完成可重复使用火箭测试；伽利略导航系统卫星成功入轨运行；BAE再获DARPA百万资助

NASA授予八家公司小卫星数据获取服务合同，总金额达4.76亿美元

为什么要推荐您参赛 | 第九届中国航空创新创业大赛报名中

NOAA发布2023 年全球气候状况报告:创纪录的高温、温室气体和海平面

下一代气象卫星：欧空局AWS北极气象卫星

多光谱星Sentinel-2即将迎来新成员

实力强劲的的美国雷达卫星公司Umbra，引领商业SAR技术革新与市场扩张

发展商业航天，要先让下游遥感产业赚钱

SpaceX Transporter计划：小卫星发射市场的五年垄断之路

商业航天观察 | 洛克希德·马丁收购Terran Orbital：从合作到控制的战略之道

商业航天速递 | Rocket Lab的卫星即将在Blue Origin火箭发射；洛克希德·马丁收购Terran Orbital

遥感大模型解读系列 | 02 SelectiveMAE:基于大规模遥感数据集的高效掩码自编码器

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉