一直以来,业界开源大模型与闭源大模型的辩论交锋激烈,厂商在开闭源路线上各有侧重。6月7日,阿里云发布开源模型Qwen2-72B。据阿里云介绍,本次开源的Qwen2-72B大模型在自然语言理解、知识、代码、数学及多语言等多项能力上均显著超越当前领先的开源模型,包括阿里云在4月底开源的Qwen1.5最大的模型Qwen1.5-110B。
在近日举行的2024智源大会上,百川智能CEO王小川表示,开源在市场上有需求,百川在6月份开了第一版,9月份开了第二版,这个开源在当时市场上产生了很好的影响力。他表示,开源也体现了一种心态。公司认识到模型的快速迭代,今天的领先并不意味着明天的竞争力。因此,开源并没有削弱百川的商业竞争力。而果断地做出了开源决策,不仅符合市场预期,也为公司赢得了声誉。如今,众多公司参与开源,共同推动中国生态追赶美国,保护知识产权,期望这个生态能够持续繁荣发展。
百度CEO李彦宏曾多次表示,大模型开源意义不大,闭源模型在能力上会持续地领先,而不是一时地领先,“开源模型会越来越落后”。5月15日,百度还发布公告称:“闭源大模型+公有云”已经成为全球AI市场的主流趋势。
比如OpenAI的GPT-4模型就是采用闭源模式,而Meta选择完全开源。其余大模型公司则将模型“低配版”开源,更高参数量的模型闭源。比如,谷歌Gemini多模态模型闭源,今年2月宣布开源单模态Gemma语言模型。
1.开源大模型与闭源大模型的优缺点分别是什么?
陈晨:开源大模型和闭源大模型各有优缺点,从模型能力看,开源大模型的透明度高,能够受到公众监督,并且具有更高的灵活性,能够依靠全球开源社区的力量驱动创新和改进,但模型的质量控制、维护和支持的稳定性是一个挑战;闭源大模型的规模相对更大,数据质量更有保障,模型的成熟度、可控性强,但也需要更高的成本、更稳定的团队和更长的研发周期来实现。
从应用层面看,由于开源模型计算成本的降低,能够吸引开发者构建更多应用,灵活应用于各行业或端侧垂类场景中,并且有利于技术的传播与普惠,于整个行业而言是推动应用创新的重要力量。闭源模型则在经过成熟的开发验证后,能够在不同行业的特定要求下提供更高的性能和效率,对于需要处理大量数据、实时响应或高计算需求的应用非常重要。
从商业模式看,开源模型可以快速渗透市场,减少推广成本,但其直接盈利能力不及闭源模型,需要构建更加多元化的商业策略。
2.为何大模型厂商在开源与闭源之间会产生分歧?哪些厂商倾向开源,哪些厂商倾向闭源?路线的选择与其发展基础有着什么必然的联系?
陈晨:开闭源路线的选择一方面来自自战略目标、市场需求、资源能力等因素的综合考虑,另一方面也来自大模型厂商自身商业化策略的考量,我们会看到,赛道内率先建立优势的厂商大多会采取闭源,希望通过高质量产品和服务来保持市场的领先地位,后发者则更倾向于开源,是希望通过广泛采用和社区合作来快速扩大市场份额。
在需求端,行业头部用户需要模型具有更高的稳定性、安全性和定制化的服务支持,因此往往更倾向于使用闭源模型,或者是利用开源模型进行增量训练与微调,核心目的都是要构建企业的专属模型。而大多数企业则看重开源模型的灵活透明且成本较低的特性,可能会选择采购或者利用开源大模型API,利用向量化方式优化自身应用。
3.从长期来看,差异化的发展路线,将会对各自带来哪些影响?
陈晨:开源模型依靠社区力量通常能够形成庞大的用户基础和开发者生态,长期来看,将会促进广泛的合作创新,且有利于技术的长期可持续性。由于数据获取能力和渠道的差异,开源模型的数据集规模可能会受到资源、隐私合规等限制,但在数据质量足够好的情况下,开源模型的能力边界仍然可以进一步拓展。虽然开源模型在创新生态上具备长期优势,但要实现创新的有效转化,产品化能力是关键要素,此外还需要关注社区建设、开放标准、安全合规以及持续的质量保证等方面的能力。
相对而言,闭源模型可以在一段时间内保持独特的技术优势,帮助大模型厂商在不同的垂直行业形成领先地位,这依赖于其一系列的服务支持,包括产品化封装与解决方案能力,大模型能力抽象与API化易用性、大模型训练与微调环节支撑与服务保障能力、任务场景实践能力,以及运营维护保障能力等,另外还需要大模型厂商持续的投入与迭代,相对封闭的模式也更加需要依靠内部力量创新,非常考验厂商投入的专注度与核心人才情况。
4.“开源”是否会降低行业门槛,破坏行业生态?此外,对于闭源大模型筑牢专利护城河的做法,大模型持续发展的生态应该从哪些方面进行维护?
技术的开源必然会降低进入门槛,通过协作与共享加速技术创新发展,也加剧了企业竞争,而闭源模型的专利壁垒能够保护知识产权,保证大模型厂商的差异化竞争优势,但相应地也会形成创新限制、增加开发应用成本。
因此行业和企业在平衡创新与知识产权保护的同时,如果在开放生态的前提下,实现开源和闭源的良性互动,并且在利用开源技术的同时,采取有效措施应对挑战,例如通过加强开源项目的质量控制和安全保障,建立技术联盟制定统一标准和规范,探索不同类型的商业模式等,将有利于共同推动行业健康发展。
注:本文为采访原文,原报道发布于《中国高新技术产业导报》2024.6.24 高新产业;标题:开源还是闭源 “百模大战”谁能胜出 作者 李洋 文章链接http://paper.chinahightech.com/pc/content/202406/24/content_54436.html
商务合作
老没:13262228281(微信同号)
媒体采访
易观分析媒介:ygfxmkt(微信号)
文章转载
Lisa:18874170483(微信同号)