大模型技术沙龙:行业深度融合与创新路径探索

科技   2024-12-20 19:30   北京  

2024年,大模型市场呈现出前所未有的蓬勃景象,各大科技公司将战略焦点聚焦于具体应用场景的深耕细作,加速推动行业定制化大模型的实践部署。大模型技术正以前所未有的深度渗透至金融、医疗、教育等众多关键领域,而且为破解这些专业领域中的复杂难题提供了创新思路与高效解决方案。
与此同时,关于大模型未来演进路径的探讨成为行业内外的关注焦点。商业化落地的策略与路径、大模型与小模型在不同场景下的优选策略、以及大模型应用的多元化方向等议题,均成为了业界深入研讨的核心内容。这些讨论不仅折射出业界对于大模型技术潜力与价值的深刻洞察,也预示着在不久的将来,大模型将在更广泛的维度上重塑各行各业,引领新一轮的技术革新与产业升级。
在这一发展背景下,12月7日,百度飞桨(张江)人工智能产业赋能中心、百度飞桨星河社区与上海交大工业创新研究院联合举办了 “大模型深度应用与产业融合” 圈层沙龙。旨在探讨大模型技术在各领域的深度应用和未来展望,促进跨界合作,共同探索大模型技术的无限可能。从大模型在硬件、软件及各行业的应用发展,再到具身智能、数据库领域的实践经验,本次活动的看点远不止于此。让我们再次聚焦活动的精彩瞬间,看看开发者们带来的前沿观点。

王佳梁:

具身智能、AI出海

AI for Science& Engineering

是工研院重点孵化领域


上海交⼤⼯研院执⾏院⻓王佳梁在主题演讲《具身智能:热点赛道分析》中分享,交⼤⼯研院主要聚焦⼈⼯智能,与交⼤⼈⼯智能学院“两位⼀体” 运营。交工大研院定位产业落地,志在孵化AI 独角兽企业,具身智能、AI出海,AI for Science& Engineering是重点孵化领域。
演讲中王佳梁院长分析了具身智能/⼈形机器⼈的价值、赛道特点、赛道的机会与挑战,以及具身智能未来发展的趋势与方向。未来,工研院将结合交大人工智能学院的资源与能力优势,持续为这个行业的创业者与企业家赋能!

王院⻓演讲主题核⼼总结
  1. 实现成果转化或者概念验证 ,就是⼯研院的重点⽬标。

  2. 国内和海外有⾮常多的信息差 ,可以在海外找—些机会。

  3. 具身智能就是把智能和物理的东⻄结合到—块 ,但凡和物理产⽣连接的都可以是具身智能

  4. 具身智能赛道 ,一部分公司解决how的问题,也就是怎么让机械更灵活,更多解决的是控制的问题。新⼀代具身智能公司解决的是what的问题,也就是到底未来具身智能应该怎样去设计的问题。

  5. 具身智能最⼤的挑战是数据集 ,具身智能数据分为两种类型:⼀种是模拟数据 ,⼀种是真实世界的数据 。模拟数据尽管能够⽆限制的产⽣ ,但是在⼈形机器⼈赛道⾥⾯模拟的数 据远远不够。



聂凯旋:

加速具身智能训练

与产业化落地ORCA物理精确模拟器


聂凯旋在题为《加速具身智能训练与产业化落地:ORCA物理精确模拟器》的演讲中介绍了松应科技的发展历程。公司推出的物理精确模拟器旨在构建一个物理人工智能仿真系统,专注于具身智能体的仿真、训练和测试。鉴于具身智能对数据的需求远超其他模型,且数据获取是其核心瓶颈,公司已将重点转向智能体训练和合成数据的创建。该系统能够构建高精度的数字仿真环境,且成本效益显著,数据采集成本仅为物理采集成本的1/100至1/200。

ORCA作为公司的核心产品,集成了物理仿真引擎、数据管线和渲染系统等多个模块,支持各类机器人的仿真训练。目前,ORCA已与多个国家级和省级人形机器人中心以及民营企业建立了合作关系,并成功与多款GPU兼容,构建了一个开放的生态系统。公司计划在未来推出更多核心产品,以进一步推动具身智能技术的发展和产业化落地。

聂凯旋演讲主题核心总结

  1. 怎么实现高质量、低成本的数据,可能会成为具身智能竞争的关键。

  2. 人形机器人当下阶段主要的核心方向已经转入到的具身智能体训练上和合成数据的打造上。

  3. (芯片在具身智能中)核心价值是如何构造一个和物理世界无限接近的,本身来自于物理世界的数据构建的数字仿真场。

  4. 未来基于仿真的合成数据可能是在具身智能当中数据生成最好的一个路径。

  5. 只有商业引擎才能实现全量的功能仿真。

  6. 高精度仿真模拟+合成数据+低数据成本=1亿资金的成本,融了几十亿的资金做具身智能。



苏鹏:

用10倍Token的投入

寻找未被发现的需求


在主题演讲《ChatDBA如何用LLM实现数据库的故障诊断》中,苏鹏深入阐述了数据库领域应用大模型的实践经验。于数据库故障诊断场景而言,最初尝试搭建 RAG(检索增强生成)系统时,其效果未尽人意,表现为回答内容空泛、细节缺失、可信度较低等情况。通过深入探究得知,从基础的 RAG 应用迈向复杂业务实践的过程中,在文档、检索、可观测性等多个维度均面临挑战。例如,文档方面存在类型繁杂多样的问题,检索环节涉及准确性、向量检索以及动态 Top K 等难题。

在故障诊断的具体实践中,首先采取让模型对无关内容进行清洗的措施,继而开展检索操作并将其与文档进行合并,随后按照特定格式对文档进行组织编排并实施评分筛选。同时,运用知识图谱技术有效降低模型产生幻觉的可能性。在多轮交互场景下,针对历史记忆、意图与主题识别以及逻辑性等问题也找到了相应的解决办法。诸如采用业界广泛应用的长短时记忆方案,借助主题树对多轮对话主题进行有效管理,利用微调与强化学习手段优化模型输出的风格特质。此外,苏鹏还分享了运用模型实现降本增效以及挖掘潜在需求的创新性思维路径与方法策略。

苏鹏演讲主题核心总结

怎么做创新?把某一个业务用模型实现降本增效,你用10倍Token的投入,寻找未被发现的需求。



Debate TALK:

颠覆性创新VS持续性创新


大模型的机会点究竟是诞生于颠覆性创新中,还是持续性创新。在场的开发者们各抒己见,我们走进听听大家的看法。
· 颠覆性创新:

李健:大模型给我最大的惊喜,就是它解决了之前人工智能行业一直没有解决的问题:对自然语言的理解。所以基于大模型我们可以开发出“真正懂用户”的应用,这是颠覆性的创新。

李健:创业来说,大模型只有做颠覆性的事情才有机会,不然大厂一更新版本就没你什么事了。

葛鸿宇:以前做不到的东西,或者是很麻烦的东西,AI现在能够非常轻易地帮他们做到,这是一种颠覆。

蔡滨彬:同学帮女朋友做作业这个事情属于持续性创新,如果他们两个因为作业繁重影响了感情快分手的时候,因为文心一言恢复了关系,这就是颠覆性创新。

左右滑动查看更多


· 持续性创新:

林伟君 :用市场去判定,技术的发展在实际的应用上就是做代替、优化。

何亚平:问题解决过程中需要不断跟原有场景需求一个一个解决小的需求点往前推,推到最后才能展现出最后的结果“哇,好智能”。

冷子昂:应用层领域,可能更多需要去考虑如何把技术性的颠覆运用到可持续性创新上面。

李灏楠:每个大厂都有抵达不了的地方,不是所有行业和所有机会都有能力和时间去做细的。对于创业者来讲,是在一个一个客户案例积累之后形成的纵深壁垒。

左右滑动查看更多


从产品和市场逻辑看,大模型在多数情况下是满足既有需求的持续性创新,但从技术范式变革角度,其蕴含着颠覆性创新的潜力,且两者相互关联,持续性创新为颠覆性创新奠定基础,颠覆性创新推动行业变革,影响持续性创新的方向。

本次沙龙为大模型领域的交流与合作搭建了优质平台,通过专家分享和互动讨论,全面展示了大模型在硬件、软件及各行业的应用现状与发展趋势。交大工研院明确了在人工智能产业孵化中的重要角色,松应科技展示了具身智能技术突破,苏鹏分享了大模型在数据库领域的实践经验。开放互动环节促进了不同领域人员的交流与合作,辩论环节深化了对大模型创新类型的理解。未来,大模型将继续深度融合产业,推动行业发展,实现技术创新与商业价值的双赢。

如果你想要参与“大模型深度应用与产业融合” 相关主题沙龙,可联系:

paddle-up@baidu.com



关注【飞桨PaddlePaddle】公众号
获取更多技术内容~

飞桨PaddlePaddle
源于产业实践的开源深度学习平台
 最新文章