王佳梁:
具身智能、AI出海
AI for Science& Engineering
是工研院重点孵化领域
实现成果转化或者概念验证 ,就是⼯研院的重点⽬标。
国内和海外有⾮常多的信息差 ,可以在海外找—些机会。
具身智能就是把智能和物理的东⻄结合到—块 ,但凡和物理产⽣连接的都可以是具身智能。
具身智能赛道 ,一部分公司解决how的问题,也就是怎么让机械更灵活,更多解决的是控制的问题。新⼀代具身智能公司解决的是what的问题,也就是到底未来具身智能应该怎样去设计的问题。
具身智能最⼤的挑战是数据集 ,具身智能数据分为两种类型:⼀种是模拟数据 ,⼀种是真实世界的数据 。模拟数据尽管能够⽆限制的产⽣ ,但是在⼈形机器⼈赛道⾥⾯模拟的数 据远远不够。
聂凯旋:
加速具身智能训练
与产业化落地ORCA物理精确模拟器
聂凯旋在题为《加速具身智能训练与产业化落地:ORCA物理精确模拟器》的演讲中介绍了松应科技的发展历程。公司推出的物理精确模拟器旨在构建一个物理人工智能仿真系统,专注于具身智能体的仿真、训练和测试。鉴于具身智能对数据的需求远超其他模型,且数据获取是其核心瓶颈,公司已将重点转向智能体训练和合成数据的创建。该系统能够构建高精度的数字仿真环境,且成本效益显著,数据采集成本仅为物理采集成本的1/100至1/200。
ORCA作为公司的核心产品,集成了物理仿真引擎、数据管线和渲染系统等多个模块,支持各类机器人的仿真训练。目前,ORCA已与多个国家级和省级人形机器人中心以及民营企业建立了合作关系,并成功与多款GPU兼容,构建了一个开放的生态系统。公司计划在未来推出更多核心产品,以进一步推动具身智能技术的发展和产业化落地。
聂凯旋演讲主题核心总结
怎么实现高质量、低成本的数据,可能会成为具身智能竞争的关键。
人形机器人当下阶段主要的核心方向已经转入到的具身智能体训练上和合成数据的打造上。
(芯片在具身智能中)核心价值是如何构造一个和物理世界无限接近的,本身来自于物理世界的数据构建的数字仿真场。
未来基于仿真的合成数据可能是在具身智能当中数据生成最好的一个路径。
只有商业引擎才能实现全量的功能仿真。
高精度仿真模拟+合成数据+低数据成本=1亿资金的成本,融了几十亿的资金做具身智能。
苏鹏:
用10倍Token的投入
寻找未被发现的需求
在主题演讲《ChatDBA如何用LLM实现数据库的故障诊断》中,苏鹏深入阐述了数据库领域应用大模型的实践经验。于数据库故障诊断场景而言,最初尝试搭建 RAG(检索增强生成)系统时,其效果未尽人意,表现为回答内容空泛、细节缺失、可信度较低等情况。通过深入探究得知,从基础的 RAG 应用迈向复杂业务实践的过程中,在文档、检索、可观测性等多个维度均面临挑战。例如,文档方面存在类型繁杂多样的问题,检索环节涉及准确性、向量检索以及动态 Top K 等难题。
在故障诊断的具体实践中,首先采取让模型对无关内容进行清洗的措施,继而开展检索操作并将其与文档进行合并,随后按照特定格式对文档进行组织编排并实施评分筛选。同时,运用知识图谱技术有效降低模型产生幻觉的可能性。在多轮交互场景下,针对历史记忆、意图与主题识别以及逻辑性等问题也找到了相应的解决办法。诸如采用业界广泛应用的长短时记忆方案,借助主题树对多轮对话主题进行有效管理,利用微调与强化学习手段优化模型输出的风格特质。此外,苏鹏还分享了运用模型实现降本增效以及挖掘潜在需求的创新性思维路径与方法策略。
怎么做创新?把某一个业务用模型实现降本增效,你用10倍Token的投入,寻找未被发现的需求。
Debate TALK:
颠覆性创新VS持续性创新
左右滑动查看更多
· 持续性创新:
左右滑动查看更多
从产品和市场逻辑看,大模型在多数情况下是满足既有需求的持续性创新,但从技术范式变革角度,其蕴含着颠覆性创新的潜力,且两者相互关联,持续性创新为颠覆性创新奠定基础,颠覆性创新推动行业变革,影响持续性创新的方向。
本次沙龙为大模型领域的交流与合作搭建了优质平台,通过专家分享和互动讨论,全面展示了大模型在硬件、软件及各行业的应用现状与发展趋势。交大工研院明确了在人工智能产业孵化中的重要角色,松应科技展示了具身智能技术突破,苏鹏分享了大模型在数据库领域的实践经验。开放互动环节促进了不同领域人员的交流与合作,辩论环节深化了对大模型创新类型的理解。未来,大模型将继续深度融合产业,推动行业发展,实现技术创新与商业价值的双赢。
如果你想要参与“大模型深度应用与产业融合” 相关主题沙龙,可联系:
paddle-up@baidu.com