AiDD对话马永亮：大模型应用规模化落地的核心是降低定制和优化的门槛

文摘 2024-07-25 17:12 北京

▼

8月16-17日即将于北京举办的“AI+研发数字峰会（AiDD）”，特邀澜舟科技合伙人、算法&应用VP马永亮老师担任《AI原生应用开发》分论坛联合出品人。

马永亮老师是哈尔滨工业大学计算机硕士。曾就职于阿里、微软等公司，在微软工作十余年, 担任微软必应搜索首席开发经理，具有丰富的研发经验。目前负责澜舟的大模型技术和应用落地, 包括 RAG、搜索、问答、报告生成、视频会议分析等。

为进一步探究大模型应用规模化落地的现状、困难与发展前景等大家普遍关心的热门话题，AiDD峰会对话了马永亮老师，围绕上述话题进行了深度沟通与探讨，并整理出如下文章内容。

▼

AiDD：大模型技术或者说AI2.0，相比于上一代AI1.0的小模型，最大突破点是什么？

马永亮：被广泛关注的大模型的技术突破有不少，比如ChatGPT推出时大家都惊叹于它的对话能力，这种对话能力中体现的对意图、上下文、多轮的理解能力跟上一代模型比有明显的突破。再有，大模型涌现出的逻辑推理的能力跟AI1.0时代比也是突破性的，包括近期关注度比较多的多模态下的模型能力文本、视频、音频统一在一个大模型中，表现出很强的交互能力，这也是具有突破性的。这些方面的突破，关注的角度是独立的应用能力和模型能力。

从生产力和产业发展上看，有3个比较重要的突破：

第一，大模型的通用性和泛化性，一个模型具备多种能力而且这些能力在比较广泛的领域都能表现得不错，这在AI1.0时代是不可想象的。

第二，模型能力的构建门槛显著降低了，大模型对自然语言指令的理解和跟随有很强的能力，人们可以通过自然语言去"调用"大模型的能力，实现模型的定制，这在AI1.0时代是不可想象的。

第三，数据生成能力。数据是AI的核心，针对应用数据的作用更加重要。X->Y这是数据最抽象的形式，Y是标注，有的学习算法需要，有的学习算法不需要，X是原始数据，是人类社会各种活动产生的数据，是进行学习必须的。典型的比如在互联网上的各种文本、图片、视频等等数据。过往的AI技术，在生成Y方面有一定能力，但是大模型不仅在生成Y上表现更好，更为重要的是它能比较高质量的生成X，这是在AI1.0时代不可想象的。

这三个在AI1.0时代不具备的能力，也是AI1.0没有像移动互联网，互联网、数据库、云计算、计算机、大规模集成电路等技术一样对社会整体产生广泛影响的关键原因。

大模型的这三点突破有望使得人工智能发展成为一个社会底层基础设施技术，从而推动AI全面的产业化。

AiDD：大模型要进一步发展，目前面临的最大挑战是什么？

马永亮：挑战很多，安全性，伦理，成本，数据枯竭，大公司竞争导致的技术封闭等等，我认最重要的挑战有两个：

技术上的发展，最大的挑战是Scaling Law主导了大模型发展的路径，造成了能源、计算资源、数据等资源的利用率边际效用在下降，这当然是一个值得奔赴的方向，但是这是众多方向中的一个，并且需要大量资源。这最大程度上利用了机器的能力，但是局限了人的力量的发挥。很多在过去的重要技术发展中起到不可或缺作用的力量，例如中小创业公司、科研机构、高校，他们中的大多数没有足够的机器和数据资源进行探索和实验，这在一定程度上会局限当今的发展，同时大家的注意力，因为媒体的宣传和商业化的推广，也被都吸引到Scaling Law这样一个方向上，其他方向上的研发面临投入不足的问题。

产业上的发展，最大的挑战是进一步降低定制、优化大模型能力的门槛。当前大模型还是不能稳定的完成一些有难度任务，而这样的任务是AI落地千行百业的基础，完成这些任务，需要对大模型进行微调，做CoT，数据合成，做RAG，Agent，工具调用等大模型应用开发框架，这些技术依然是需要研发工程师有大模型相关的模型、算法和工程的能力。通过降低这些门槛，让大模型能够在更广阔的方位内落地，产生价值，这样才能反哺大模型技术的研发，给大模型技术的研发提出新的问题方向，为大模型未来的应用前景提供更广阔的空间。

AiDD：大模型规模化落地，AI产业化的关键是什么？

马永亮：要想让AI技术成为人类社会的底层基础设施，意味着千行百业，万千场景都要被AI深入影响。我有一个AI产业化象限的分析工具，它有三个维度：效果、人力、门槛。效果很好理解，效果上一定是满足要求的基础上越高越好。

人力，需要多少人力资源。门槛，需要具备什么样专业能力的人。在这个象限中有几个重要的点。第一点，我称之为成本之殇，这个点是门槛高，人力多，效果好。人力多+门槛高，成本高企，难以规模化。第二点，互联网平台模式，门槛高+人力少。

互联网平台的对AI专业人才的要求比较高这个都能理解，人力少怎么理解？

第一，互联网公司的人数一般在几千到几万，更多一点的在十几万。这里面当然有一定比例的专业技术人员，但是不管怎样，和赋能千行百业需要的人员比起来肯定是少的。第二，用户数和营收规模，以搜索引擎为例，服务的用户数在几亿到几十亿，年营收在几百亿甚至上千亿美元。跟这两个规模比起来，人数也是少的。对于互联网平台类性的企业，它能接受门槛很高的问题，因为他有规模效用，高门槛的成本可以轻松被规模摊薄。第三，是终极AGI，这个点上人力少、门槛低、效果好。因为AGI实现后，本质上工作已经不需要人干了，只要把最终的需求交给AGI，它就能完成。所以人也少、也不需要清楚AI技术原理，门槛就很低了。AGI能不能达成是个时间、技术和人类定位的终极问题，我没有答案，但是在当前这代人的时间尺度上看，真正的AGI还有很多障碍，我们要有Plan B。第四，我称之为AI产业化的起点，我认为的Plan B，人力多，门槛低，效果好。这基于几个判断，首先千行百业，万千场景，是不是一个很通用的大模型就能够解决？在终极AGI中可以，现在不行，可预见的未来也不行，那么就需要大量的AI产业从业人员。大量的人员，如果门槛很高，那就又变成了"成本之殇"。所以一定需要一个门槛低、人力能够得到大量供给的条件。

当前全球大概有2600万~2900万的软件开发人员，上限接近3000万，而且还在增加。他们中的绝大多数都不是从事AI能力研发的工程师，如果这3000万人，除了能做传统意义的软件开发，也能够为AI相关的需求进行AI能力的定制和优化，那么支持千行百业的AI落地就成为可能了，就像这些软件工程师今天正在或者已经为千行百业开发了大量的传统应用，这些传统应用有相似的底层技术，但是从应用角度看又有各种区别，各种定制的需求的体现，软件开发产业今天就是一个这样的低门槛、多人力的模式。所以，大模型规模化落地，AI产业化的关键是能不能把AI落地的门槛降低，降低到可以被3000万从业人员掌握。

AiDD：大模型应用ToB和ToC的落地逻辑有哪些不同？

马永亮：大模型落地有3个关键的要素，这3个要素上ToB和ToC都有一些差异。

技术

ToC和ToB在技术上都要满足效果的要求，效果和体验不好都不行。另外一个重要维度是成本，toB和ToC都需要成本低，但是，在成本低这一点上体现为对技术的不同要求。ToC的成本下降模式是规模效用，也就是说技术本身还是可以非常昂贵，但是因为用得人非常多，所以成本低。那么ToC的技术，在落地的时候，就可以尽可能的把最前沿、最复杂、门槛最高的技术只要能够带来效果和体验的切实提升，满足边际成本的要求，都可以。而ToB的成本下降，在于针对定制需求的响应上，需要技术的通用性、低门槛、自动化。

产品

ToB的需求往往来自客户，而不是产品的设计者，有较强的定制性。多数情况是去理解需求、相应需求、引导需求和创造需求是需求的。

ToC的需求的源头是用户，而产品的设计者同时也是用户，他们是一体的。理解和满足需求的同时，可以引导和创造需求。

为什么呢？这里面有一点很大的差异，ToB需求的满足，不是在满足一个独立的个体，而是满足这个个体所在的环境作为一个整体的需求，需要整个环境整体来决策。而ToC满足的需求，是一个体的需求，一个个体的需求只需要这个个体来决策。所以，行业的标杆作用很明显，一个在行业内有影响力的头部公司的需求和落地案例，对于整个行业都有一定的借鉴意义。

市场

ToB的销售依赖建立和维持稳定和长期的客户关系，一个消费决策过程比较长，而ToC刚好相反。因此销售和营销策略有很大不同。另外一个在ToB上和ToC上不同的就是，行业的生态。ToC的公司要做好，公司自己把产品做好是最为重要的，甚至就是唯一重要的。但是ToB，要考虑行业的生态，一个ToB的公司在生态中的定位、生态关系的建立是ToB企业规模化的重要问题。起步阶段还不明显，做大、做强要提前规划、动态调整。

AiDD：ToB大模型企业如何构建数据飞轮？

马永亮：ToB的数据飞轮过去一直被质疑，由于数据安全的问题，ToB的数据飞轮存在挑战是很现实的。我们都知道AI或者大模型非常依赖数据，根本上来说大模型的能力是从数据中学习得到的。所谓数据飞轮就是模型的能力或者产品的效果可以随着它不断被使用，不断积累数据，最终越来越好。

典型的搜索引擎、信息流、短视频、电商，这些都是在C端非常典型和成功的数据飞轮。那ToB有哪些潜在的数据呢？首先是用户使用模型或者产品的数据，这些数据一方面涉及到个人的行为，另一方面涉及企业内部数据，没有形成数据飞轮的条件。这之外有三种数据，公开数据，比如在多数垂直领域，都有大量的公开数据；大模型生成的数据，上面提到了，大模型的一个突破点就是生成，大模型为当前场景生成大量数据；AI落地流程的研发行为数据，这个简单理解就像写程序经常调用什么库和API等。

后面这三种数据，都有形成数据飞轮的条件，并且这些数据飞轮覆盖了AI落地的重要环节，从而能够使得AI在不断的落地过程中积累越来越多的数据，最终提升效果，增加效率，降低门槛。

AiDD：澜舟科技在大模型研究和应用上的重点是什么？

马永亮：在研究方向上，澜舟持续的优化孟子大模型底座，一方面为应用10B左右的模型场景提供最强的开源模型，另一方面我们也为有对模型底座进行优化的客户提供这样的技术支持，最后，在大模型技术的应用场景中，有很多技术问题需要对模型底座的技术有清楚的理解和定制能力。

模型底座之外，澜舟一直以来都在RAG/Agent/大模型数据合成等领域持续的投入研发资源，而且这些方向和应用场景的交互更加频繁，更容易从客户的需求和大模型在实际落地中的问题得到反馈，从而提升研发和创新的速度。创新的速度是非常重要的一个维度，随着技术的扩散，任何重要的技术最终都会变成这个社会的基础设施，也就是说会比现在容易获取得多，那么持续的，快速的创新才是提升竞争力，引领行业的最有力武器。

通过这些领域的研发投入，不断优化我们的3个重要产品：澜舟智库、澜舟智会和澜舟智搭。这三个产品，是我们针对企业场景设计的大模型原生应用，让企业能够拥有直接可应用的大模型并且具备自主开发迭代大模型应用的能力。

END

“AI+研发数字峰会（AiDD）”旨在帮助更多企业借助AI技术，使计算机能够更深入地认知现实世界，推动研发全面进入数智化时代。北京站即将于8月16-17日盛大启幕！本届峰会共设十五大分论坛，两个大厂专场，围绕AIGC产品创新、AI原生应用开发、LLM测评、智能体与具身智能、领域多模态大模型、知识工程等技术热点，邀请近百家企业界和工业界大咖共赴盛会。

点击下方“阅读原文”或扫描下方海报二维码了解更多峰会信息。

点这里↓↓↓记得关注标星哦~

http://mp.weixin.qq.com/s?__biz=MzA5NzE4NDkxMg==&mid=2652106484&idx=1&sn=1dfb51da9ef9ac8f147cc8a035838200

中智凯灵

中智凯灵（KeyLink）是国内领先的专业数字人才发展平台，面向科技研发型企业和组织提供数字化人才培养的专属成长地图，数字化转型的方法 + 智库。

最新文章

2024AI+研发数字（AiDD）峰会深圳站圆满收官！

参会指南来啦！AiDD峰会深圳站倒计时3天，期待您的到来！

深入浅出 OpenAI Swarm 源码二：多 Agent 框架调度流程

深入浅出 OpenAI Swarm 源码一：多 Agent 调度框架概念抽象

“AI+工程”线 | AI+研发数字峰会（AiDD）深圳站五大条线陆续揭晓

“AI+领域”线 | AI+研发数字峰会（AiDD）深圳站五大条线陆续揭晓

高通骁龙峰会AI又是主角，或将开启终端侧生成式AI新时代

“AI+测试”线 | AI+研发数字峰会（AiDD）深圳站五大条线陆续揭晓

“AI+开发”线揭晓| AI+研发数字峰会（AiDD）深圳站携60+前沿实践案例重磅来袭！

从木匠到AI教父：Geoffrey Hinton的传奇之路

恭喜KeyLink嘉宾智库成员陶建辉、朱思语获得2024年“CCF杰出工程师奖”

突发！OpenAI CTO离职，同日奥特曼被曝将获得股权

为什么AI不会夺去软件工程师的工作？

华为云联合中国信通院发布国内首部《智能化软件开发落地实践指南》，引领AI驱动开发新时代

用AI五分钟就能生成一档播客？感觉降维打击了

OpenAI o1 强化学习背后的自博弈（Self-play）方法介绍

OpenAI o1模型凌晨震撼发布，AI界迎来革命性变革

上6休3上3休2……这烧脑的调休安排，国内外AI都算不明白，集体大“翻车”！

大模型如何改变软件开发的游戏规则？

AI重塑软件行业，个人和组织如何实现弯道超车？| AiDD

开发者噩梦！69% 的程序员每周浪费 8+ 小时，技术债是最大“时间黑洞”

再次扬帆起航：启动2024年「软件研发应用大模型」的调查

何小鹏的Model 2，爆单了

“蓝色巨人”在中国的下线，是否标志着科技鸿沟转折点的到来？

李沐：创业一年，人间三年！

AiDD峰会北京站TOP10议题新鲜出炉，快看看有没有你喜欢的议题上榜！

2024AI+研发数字（AiDD）峰会北京站圆满收官！

参会指南来啦！AiDD峰会北京站倒计时3天，期待您的到来！

首位获得IEEE TCSE新星奖的中国学者黎立，将受邀出席AiDD峰会发表主旨演讲

上海交大AI研究院沈为：我相信奇点将至，但更信脚踏实地

GPT-4o的语音模式终于来了！电影《Her》变成现实...

2024“人工智能+”行动第2弹——AiDD峰会北京站即将发射！

AiDD对话马永亮：大模型应用规模化落地的核心是降低定制和优化的门槛

谈一谈LLM在推荐域的一些理解

对话数据科学家巴川：创新勿忘初心，未来属于有温度的AI

院士领衔推出大模型的第3种记忆：比参数存储和RAG都便宜，2.4B模型越级打13B

大语言模型在金融领域的应用:进展、前景与挑战

麦肯锡报告：2030年，哪些行业会衰落？AI首先会取代哪些工作？

AI驱动研发变革，促进企业降本增效！AI+研发数字峰会北京站议题火热征集中

K+峰会上海站TOP10议题新鲜出炉，快看看有没有你喜欢的议题上榜！

来自大厂优秀课代表的学习笔记-AiDD峰会上海站

2024K+全球软件研发行业创新峰会上海站圆满收官！

来啦来啦~K+峰会上海站即将发车，请再次确认您手中的“车票”

‘AI+人’访谈录 | 四秩编程路，爱折腾的匠人梦

大模型编码目前最有效的模式

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉