LLaMA系列一直在假装开源...

科技 2024-11-02 00:03 北京

伙伴们，很奇怪~ 关于LLM的开源与闭源模型的竞争又开始愈发激烈。

众所周知，开源模型以其开放性和社区驱动的特点受到一部分用户的青睐，而闭源模型则因其专业性和性能优化被广泛应用于商业领域。由于大模型最近2年的突然兴起，开源社区对“开源”有了重新定义。终于开放源代码倡议（OSI）于10月2日首次发布了开源 AI 定义的暂行版本 1.0，其中Meta 和 Google等作为其重要参与者，为LLaMA等披上了“开源”的外衣，为什么这么说呢。于是这次专门写个文章主要想通过技术、商业等层面的比较，一起探讨下开源、假装开源和闭源这件事。

(: 主要是网上吵的太厉害。。谈谈鄙人浅薄的看法吧。。

到底啥是开源、假装开源和闭源？

在讨论开源与闭源模型的优劣之前，我们首先要明确两者的定义。开源模型指的是那些源代码、数据集、训练过程等对公众开放，允许自由使用、修改和分发的模型。假装开源就比如LLaMA等大部分目前所谓的开源模型，因为它们只开源了模型参数而已。而闭源模型则是这些要素不公开，通常由单一实体控制，使用受限的模型。开源模型因其透明性和社区参与度高而受到一部分开发者的喜爱；假装开源模型则可以让我们感觉到自我认为我们能掌控该模型的所有；但闭源模型在性能优化、安全性和专业性服务方面可能更具优势。

开源模型的最大特点是其开放性，这使得全球的开发者都可以参与到模型的改进和创新中来。然而，这种开放性也带来了一定的风险，比如安全漏洞和隐私泄露。相比之下，闭源模型由于其源代码和数据集的不公开，能够提供更好的安全性和隐私保护，同时，专业的团队也能够对模型进行更深入的优化。大家可能会搞混淆的另一个概念是软件开源，这俩的区分是：软件开源主要针对应用程序和工具，开源的资源需求较低，而大语言模型的开源则涉及大量计算资源、训练细节、高质量数据和最终的模型参数，并且可能有更多使用限制。

技术层面的比较

在性能与优化方面，闭源模型通常由专业团队进行优化，能够针对特定的应用场景进行定制和调整，因此在性能上可能更优。假装开源模型因为不开源优化细节trick等非常核心的部分，导致大家无法复现其完全公布的性能，只能接近；而开源模型能够快速集成社区的创新，但其优化速度和效果往往受限于社区的活跃度和技术能力。数据集与训练过程也是衡量模型优劣的重要指标。闭源模型可能使用更高质量或更大规模的数据集进行训练（默认闭源都是公司级别主导的）；假装开源模型则不公开数据集和具体训练过程，只能让你用训好的模型，但无法改进，在不这样的情况下train或者sft模型直接会影响了模型的准确性和鲁棒性的...；而开源模型的数据集和训练过程可能不够完善。

在安全性与隐私方面，闭源模型由于其不公开的特性，能够更好地控制数据的使用和流动，从而提供更好的安全性和隐私保护（意思就是你看不到我数据，无法直接发现我的漏洞）。假装开源模型可以直接让大家通过各种后门攻击来直接测试漏洞是否存在，很危险。而开源模型必然也可能存在安全漏洞和隐私泄露的风险，尤其是在数据集和训练过程中，但是能够和黑客进行攻防战，在不涉及难以挽回的场景下，可以不断优化安全领域的研究工作~

易用性与支持也是用户选择模型时考虑的重要因素。闭源模型通常提供专业的技术支持和客户服务，易用性较高。而假装开源和开源模型一样了，虽然社区活跃，但支持可能不及时或不专业，这对于需要快速解决问题的用户来说可能是一个缺点。

实际案例分析

以Meta的LLaMA模型为例，尽管LLaMA模型开源，但其使用条款中存在一定的限制，比如对于拥有超过7亿用户的应用程序的商业用途限制，以及不提供对训练数据的访问，这导致其不符合开放源代码促进会（OSI）的开源标准。这表明即使是开源模型，也可能存在使用上的限制，并不总是能够满足用户的需求。

另一方面，OpenAI的ChatGPT（o1-mini/o1-preview/GPT-4o等）以及国内百度的ERNIE模型作为闭源模型，虽然也被诟病不开源啥的，在实际应用当中表现出了更高的性能和易用性（难以想象吧~）。通过对少量数据的精调和后预训练，ERNIE模型在AI续写等场景中的表现优于同等参数规模的开源模型，这证明了闭源模型在特定业务场景下的优势。

商业与市场角度

从商业模式的角度来看，开源模型可能依赖于社区和广告收入，其商业模式可能不如闭源模型明确。闭源模型通过订阅服务和专业技术支持创造收入，商业模式更为成熟和稳定~

哎，还是钱钱钱~ 没办法~

在市场竞争力方面，闭源模型因其专业性和性能优化，在专业领域和高端市场中更具竞争力。而开源模型则在教育和非盈利领域更受欢迎，因其开放性和低成本的特点。

结论

综上所述，开源模型并不一定比闭源模型好。现在突然想到了某度老板曾说过：开源模型会越来越落后。当初不以为然，现在深层考虑下，好吧，或许说得也有些道理。

选择模型时应考虑具体的业务需求、技术条件以及市场环境。开源模型的开放性和社区驱动的特点在某些场景下具有优势，而闭源模型在性能优化、安全性和专业性服务方面可能更胜一筹。因此，用户在选择模型时，应根据自身的需求和条件，做出最合适的选择。

但是对于咱们普通人来说，随便玩玩模型，当时我必站队开源啊，否则我咋发论文？科学咋进步？嘿嘿~

公司那种高端服务，对于准确率和成本还要求特别严格的，还是踏踏实实选择闭源的服务吧。开源你玩不起，成本你都hold不住，谁让它们假装开源！给你400+B的我看你finetune到啥时候才能商用~

说到这吧，下课~

http://mp.weixin.qq.com/s?__biz=MzIxNDgzNDg3NQ==&mid=2247549684&idx=3&sn=d31c390d8f56a037f29831affb02a0c4

深度学习与NLP

专注深度学习、NLP相关技术、资讯，追求纯粹的技术，享受学习、分享的快乐。

最新文章

离谱！裁员裁出新高度了。。

斯坦福大学教授李飞飞团队：关于 2024 年人工智能发展报告总结

多模态大模型技术点总结

中科院院士：青年科学家 5 年内拿不出成果就面临淘汰，有的单位已现「马太」效应，重复给某一人奖励

[送5本]《科技论文写作指南》理工科学生福音

o1圈杀疯了，阿里又开源Marco-o1

吴恩达力荐，100%好评-《LangChain大型语言模型(LLM)应用开发》免费分享

这才是真・开源模型！公开「后训练」一切，性能超越Llama 3.1 Instruct

新一轮高校裁员潮，来了！

[送5本]《动手学自然语言处理》大模型改变了NLP的游戏规则了吗

LLM逻辑推演策略选择：推理时计算 vs 训练时计算

仅仅一天，Gemini就夺回了GPT-4o拿走的头名

教育部公布！25考研人数，再降50万！

大模型代肝，自动刷《崩铁》升级材料，Claude操纵计算机还能这么用！

一篇小型语言模型技术最新全面综述

M3DocRAG：文档问答用哪个多模态大模型效果最好？

已公示！“东方理工大学”，来了

聊一聊做角色扮演大模型的经验

绝对顶流！清华博导倾力编写的《图神经网络导论》pdf免费分享

最高9.0分！这16篇最高分ICLR2025论文必看！从生成模型到MOE等

ICLR 高分：深入研究多模态大模型的对齐策略

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

双非二战字节算法岗，拿下70k offer.....

猫猫运动方程，首次被物理学家破解！ |《美国物理学杂志》正经研究

o1的风又吹到多模态，直接吹翻了GPT-4o-mini

谷歌大佬编写，我唯一熬夜看完的机器学习神作pdf分享！

微调图像大模型的经验分享

昨夜， LLM 已经彻底凉凉了...

Karpathy后悔了：2015年就看到了语言模型的潜力，却搞了多年强化学习

微软开源角色Agents，直接模拟了整个世界~

2024最新神书-《大模型应用程序构建指南》免费pdf分享

2024最新,李宏毅深度学习教程pdf免费分享！绝对值得反复阅读的神书！

已注销！985新校区，不建了

RAG黑盒被打开了，可视化RAGViz闪亮全场

LLM性能优化中的一些概念扫盲

Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

Cursor一不小心把自家的底牌也放出来了~

[送5本]《动手学机器学习》上海交大ACM班总教头团队重磅新作，带你动手学机器学习！

传说中Ilya Sutskever精选论文清单：AI领域40大论文完整版「破解」完成

神书《从零构建大模型》分享，尚未发布，GitHub标星22k！！

LLM性能优化中的一些概念扫盲

暴跌94%，裁员9600人。。。

[送5本]《大语言模型：原理、应用与优化》大模型未来发展方向大揭秘！

多个中国团队斩获EMNLP'24最佳论文！UCLA华人学者中三篇杰出论文，明年顶会落户苏州

DRL2022新书-《深度强化学习》免费pdf分享

陶哲轩：计算机通用方法，往往比深奥的纯数学更能解决问题

中央批准：中央候补委员、教育部副部长，任C9大学书记

谷歌2024博士奖学金公布，KAN作者刘子鸣等数十位年轻华人学者入选

上交2024最新-《动手学大模型》实战教程及ppt分享！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉