▲ 点击图片报名,抓住风口(iOS用户请用电脑端打开小程序)
本期要点:AI时代的历史韵脚
你好,我是王煜全,这里是王煜全要闻评论。
2024年12月26日,平时并不为人所知的幻方量化正式发布并开源了AI大模型DeepSeek-V3,一时间在互联网上引起了不小的轰动。据说这个模型总共包含了6710亿个参数,在代码和数学领域表现卓越,在多个基准测试中展现出与GPT-4o和Claude-3.5-Sonnet相匹敌的性能,被誉为当前最强开源模型。尤为值得一提的是,DeepSeek-V3有极具竞争力的成本优势,其总训练成本仅为500多万美元。要知道,如ChatGPT-4等大模型的训练费用常常动辄数千万乃至上亿美元。而DeepSeek-V3的推理成本更是低得让人吃惊,只需1美元就能运行5个小时,相比之下,同样的金额在Claude上只能运行十分钟。就如Kimi曾经横空出世时一般,网友们纷纷惊呼国产大模型的希望居然在这儿,甚至认为国产的“o1模型”也指日可待了。DeepSeek大模型背后的母公司幻方量化也随之冲上了热搜。当然,也有人指出,DeepSeek-V3仍然有较大局限性,主要依赖已知技术组合优化,缺乏底层原理创新,虽然注重性价比,体现了降成本方面的巨大潜力,但探索不足,也缺乏多模态、逻辑推理等新功能,有典型的“中国特色”。首先,DeepSeek-V3在降成本方面的做法,毫无疑问具有重大意义。对于AI大模型来说,性能调优至关重要,将直接决定AI的应用广度和深度。自工业革命以来,所有的科学技术要进入产业、变成产品和服务、进而对社会产生深刻影响,都离不开对技术所进行的性能调优、参数调整以及结构上的小改动。这不仅仅局限于核心技术本身,还包括与之配套的各项技术。也只有当这些技术的性能足够好、成本足够低时,相关产品和服务才能得以推向市场,并被用户广泛接受。就像火车的核心技术虽然是蒸汽机,但要让火车真正跑起来,要对蒸汽机进行优化,还需要铁轨的配合,而且直到火车票的价格低至大众能承受的范围时,火车的使用才会全面铺开,并进而对整个社会产生深远影响。因此,从瓦特蒸汽机被发明,到第一列火车的出现,隔了30多年的时间,而火车得到广泛使用,则更是用了近百年时间。同样,AI大模型的优化,也不能只停留在模型本身,还需要考虑如何更好地利用数据、如何设计更高效的算法,并且要将价格“打下去”,让用户能负担得起。例如DeepSeek-V3采用了混合专家架构(MoE,Mixture-of-Experts),因此在推理过程中,其6000多亿个参数中只有300多亿个参数会被激活。这无疑大幅提高了效率,降低了运营成本。低成本,却保持了不俗的性能,再加上DeepSeek-V3的开源属性,以及极具竞争力的API定价,使得开发者和研究人员无需支付高昂的费用,也能参与到AI大模型的前沿创新之中。这不仅会极大提升DeepSeek相关产业生态的活力,加快AI技术的发展和应用,还将让AI飞入寻常百姓家,成为人们触手可及的高科技。所以,DeepSeek确实和其他中国制造有相似之处,那就是,他们在产业化上作出的贡献同样是技术的进步,但却被低估了。
其次,虽然说DeepSeek-V3并没有颠覆性的架构创新,只是对现有技术的优化和组合,但我们不妨反问一句,OpenAI的o1模型在底层技术上真的有什么特别颠覆性的突破吗?O1模型依靠内部构建出的详尽“思维链”,一步步拆解复杂问题,再结合强化学习机制,不断纠正错误,直至找到最优解。这一过程,不仅提升了模型的准确性,更赋予了它类似人类慢思考的能力,使得它在处理数学、编程乃至科学难题时,展现出了超乎想象的智慧。但话说回来,这一做法似乎也谈不上有什么底层原理的创新。而且,为了保证o1和o3等模型的性能,OpenAI还采用了更为复杂的训练算法和定制化的数据集,从而大幅增加了开发成本与运行费用。因此,o1模型的输入和输出费用是GPT-4o的数倍,而未对公众推出的o3模型,解决单个任务的费用更是可能高达数千美元。然而,这并不妨碍大家普遍认为o1模型是一个很大的进步。所以,在先进技术从实验室走向市场的过程中,其实并没有必要过于强调底层原理的创新,各种功能的组合和优化同样重要,而追求性价比也是一个有利于科技产业和经济社会发展的正确选择。其实这是个普遍存在的规律,就像特斯拉的贡献并不是发明了锂电池,而是通过性能调优,使电动车变成价格最亲民的车型之一。大模型领域不过也是在做同样的事情。回顾过去两年,我们认为,AI大模型的发展确实发生了一个重大转型,从底层架构转向应用性能的突破,这也意味着AI技术的相关应用将随之蓬勃发展起来。对于中国的企业和创业者来说,现在是一个不容错过的时间点。我们不能等到别人已经完成了技术的性能调优后再跟进,而是要在基本原理得到突破后就第一时间介入,发挥我们降本增效方面的特长,再通过大量数据和资金的投入,实现模型性能的提升,助力AI技术的应用和普及。这其实正是中国制造对技术进步的独特贡献。可以说,DeepSeek-V3正是这一思路的体现。通过精细的性能调优和成本控制,它也能在强者如林、竞争激烈的AI大模型市场上占据一席之地。希望有更多的中国大模型借助中国优势,在AI领域实现反超。对我们每个人也是如此,本次AI技术革命将带领人类进入服务规模化的时代,整个社会都将发生巨大变革。我们每个人,只有保持对新技术、新趋势的敏锐洞察,并结合自身优势,适时地参与到科技浪潮之中,才能在激烈的竞争中脱颖而出,为社会产生实实在在价值的同时,也为自己获得商业上的成功。DeepSeek的成功说明,到了中国的企业家、创业者们下场开发AI应用的时候了。科技是这个时代最大的红利。所以,做个硬广,向你推荐前哨AI少年冬令营,为孩子解锁AI新技能,打开接入未来世界的大门。冬令营将在2月初开课,为了保证课程和答疑质量,冬令营席位有限,快快报名吧!历届特训营会员以及AI小课学员还有专属优惠!点击报名→前哨AI少年冬令营2025开启报名!
↓前哨AI冬令营,解锁AI未来(扫码加入)
以上就是今天的内容,更多详细的产业分析和底层逻辑,我会在科技特训营里分享,欢迎关注全球风口微信号,报名加入。推荐阅读:
AI教父居然得物理学奖!谷歌AlphaGo之父也获奖。AI将大爆发?
大变革!孩子越卷,却越没啥用!这才是教育真相!
王煜全:当下这5年,会定义下一个100年
【科技特训营】看懂科技产业,离不开长期观察。线上书院模式,与王老师深度链接!为未来五年做好准备,先人一步,看清未来!
↓¥399,掌握王煜全AI产业预测精华(iOS用户请在电脑端打开)
↓点击加入,学会用AI为你工作(iOS用户请在电脑端打开)
此外,我们还为您准备了一份清单
“全球AI独角兽TOP10”