分析师洞察|开源还是闭源 “百模大战”谁能胜出

文摘   2024-07-04 17:04   湖南  

易观分析:在AI技术革新与商业化路径探索的过程中,当下大模型的开源与闭源之争正在成为焦点,开闭源路线的选择不仅涉及技术共享与创新的边界,还关系到企业核心竞争力的塑造,以及产业生态的构建,如何平衡开放与封闭、创新与保护,如何制定合理的商业策略来实现可持续发展,是值得深入讨论的命题。


   一直以来,业界开源大模型与闭源大模型的辩论交锋激烈,厂商在开闭源路线上各有侧重。6月7日,阿里云发布开源模型Qwen2-72B。据阿里云介绍,本次开源的Qwen2-72B大模型在自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的开源模型,包括阿里云在4月底开源的Qwen1.5最大的模型Qwen1.5-110B。


在近日举行的2024智源大会上,百川智能CEO王小川表示,开源在市场上有需求,百川在6月份开了第一版,9月份开了第二版,这个开源在当时市场上产生了很好的影响力。他表示,开源也体现了一种心态。公司认识到模型的快速迭代,今天的领先并不意味着明天的竞争力。因此,开源并没有削弱百川的商业竞争力。而果断地做出了开源决策,不仅符合市场预期,也为公司赢得了声誉。如今,众多公司参与开源,共同推动中国生态追赶美国,保护知识产权,期望这个生态能够持续繁荣发展。

百度CEO李彦宏曾多次表示,大模型开源意义不大,闭源模型在能力上会持续地领先,而不是一时地领先,“开源模型会越来越落后”。5月15日,百度还发布公告称:“闭源大模型+公有云”已经成为全球AI市场的主流趋势。

比如OpenAI的GPT-4模型就是采用闭源模式,而Meta选择完全开源。其余大模型公司则将模型“低配版”开源,更高参数量的模型闭源。比如,谷歌Gemini多模态模型闭源,今年2月宣布开源单模态Gemma语言模型。


1.开源大模型与闭源大模型的优缺点分别是什么?

陈晨:开源大模型和闭源大模型各有优缺点,从模型能力看,开源大模型的透明度高,能够受到公众监督,并且具有更高的灵活性,能够依靠全球开源社区的力量驱动创新和改进,但模型的质量控制、维护和支持的稳定性是一个挑战;闭源大模型的规模相对更大,数据质量更有保障,模型的成熟度、可控性强,但也需要更高的成本、更稳定的团队和更长的研发周期来实现。

从应用层面看,由于开源模型计算成本的降低,能够吸引开发者构建更多应用,灵活应用于各行业或端侧垂类场景中,并且有利于技术的传播与普惠,于整个行业而言是推动应用创新的重要力量。闭源模型则在经过成熟的开发验证后,能够在不同行业的特定要求下提供更高的性能和效率,对于需要处理大量数据、实时响应或高计算需求的应用非常重要。

从商业模式看,开源模型可以快速渗透市场,减少推广成本,但其直接盈利能力不及闭源模型,需要构建更加多元化的商业策略。


2.为何大模型厂商在开源与闭源之间会产生分歧?哪些厂商倾向开源,哪些厂商倾向闭源?路线的选择与其发展基础有着什么必然的联系?

陈晨:开闭源路线的选择一方面来自自战略目标、市场需求、资源能力等因素的综合考虑,另一方面也来自大模型厂商自身商业化策略的考量,我们会看到,赛道内率先建立优势的厂商大多会采取闭源,希望通过高质量产品和服务来保持市场的领先地位,后发者则更倾向于开源,是希望通过广泛采用和社区合作来快速扩大市场份额。

在需求端,行业头部用户需要模型具有更高的稳定性、安全性和定制化的服务支持,因此往往更倾向于使用闭源模型,或者是利用开源模型进行增量训练与微调,核心目的都是要构建企业的专属模型。而大多数企业则看重开源模型的灵活透明且成本较低的特性,可能会选择采购或者利用开源大模型API,利用向量化方式优化自身应用。


3.从长期来看,差异化的发展路线,将会对各自带来哪些影响?

陈晨:开源模型依靠社区力量通常能够形成庞大的用户基础和开发者生态,长期来看,将会促进广泛的合作创新,且有利于技术的长期可持续性。由于数据获取能力和渠道的差异,开源模型的数据集规模可能会受到资源、隐私合规等限制,但在数据质量足够好的情况下,开源模型的能力边界仍然可以进一步拓展。虽然开源模型在创新生态上具备长期优势,但要实现创新的有效转化,产品化能力是关键要素,此外还需要关注社区建设、开放标准、安全合规以及持续的质量保证等方面的能力。

相对而言,闭源模型可以在一段时间内保持独特的技术优势,帮助大模型厂商在不同的垂直行业形成领先地位,这依赖于其一系列的服务支持,包括产品化封装与解决方案能力,大模型能力抽象与API化易用性、大模型训练与微调环节支撑与服务保障能力、任务场景实践能力,以及运营维护保障能力等,另外还需要大模型厂商持续的投入与迭代,相对封闭的模式也更加需要依靠内部力量创新,非常考验厂商投入的专注度与核心人才情况。


4.“开源”是否会降低行业门槛,破坏行业生态?此外,对于闭源大模型筑牢专利护城河的做法,大模型持续发展的生态应该从哪些方面进行维护?

技术的开源必然会降低进入门槛,通过协作与共享加速技术创新发展,也加剧了企业竞争,而闭源模型的专利壁垒能够保护知识产权,保证大模型厂商的差异化竞争优势,但相应地也会形成创新限制、增加开发应用成本。

因此行业和企业在平衡创新与知识产权保护的同时,如果在开放生态的前提下,实现开源和闭源的良性互动,并且在利用开源技术的同时,采取有效措施应对挑战,例如通过加强开源项目的质量控制和安全保障,建立技术联盟制定统一标准和规范,探索不同类型的商业模式等,将有利于共同推动行业健康发展。



注:本文为采访原文,原报道发布于《中国高新技术产业导报》2024.6.24 高新产业;标题:开源还是闭源 “百模大战”谁能胜出 作者  李洋 文章链接http://paper.chinahightech.com/pc/content/202406/24/content_54436.html





易观分析内容速览
易观分析:中国人工智能产业应用发展图谱2023(行业合集)
易观分析:中国制造业人工智能行业应用发展图谱2023
易观分析中国零售业人工智能行业应用发展图谱2023

联系我们

商务合作

老没:13262228281(微信同号)

媒体采访

易观分析媒介:ygfxmkt(微信号)

文章转载

 Lisa:18874170483(微信同号)


声明须知
声明须知:易观分析在本文中引用的第三方数据和其他信息均来源于公开渠道,易观分析不对此承担任何责任。任何情况下,本文仅作为参考,不作为任何依据。本文著作权归发布者所有,未经易观分析授权,严禁转载、引用或以任何方式使用易观分析发布的任何内容。经授权后的任何媒体、网站或者个人使用时应原文引用并注明来源,且分析观点以易观分析官方发布的内容为准,不得进行任何形式的删减、增添、拼接、演绎、歪曲等。因不当使用而引发的争议,易观分析不承担因此产生的任何责任,并保留向相关责任主体进行责任追究的权利。




易观分析
中国数智化领域专业的科技和市场分析机构。经过20多年行业积累,形成以行业、企业、技术与产品数据为核心的订阅服务,通过专业分析师,帮助客户在数字化商业模式和技术方面,有效进行选择、评估和实践导入,从而提升企业数字业务能力,改善市场竞争力
 最新文章