智谱,豆包,及国外大模型的发展路线分析

2024-12-18 21:16   北京  

11月30日,智谱开了GLM-PC的发布会,12月18日,火山开了豆包的发布会,结合这一段美国公司的一些动向,一起看看。

本文简单比较智谱,豆包,Google的情况,并在此基础上,分析原因,动机及未来发展,也包含其它厂商的一些比较。

01

智谱


智谱,模型与应用协同的agent,在部分领域深入挖掘应用场景

1)模型向视觉发展

2)Agent开始实用

在发布会上,智谱的AI能够控制手机,控制PC,完成一些日常工作生活里的场景,包括处理工作,发红包,完成购物等,都是在解决很具体的场景需求,实现真正的助理能力。

3)模型向小,向终端发展

智谱的模型小型化,向终端发展,也表现出一个非常具体的方向。与荣耀手机的合作是非常具体的场景。

简单说,智谱的发展,是在垂直领域解决问题,深入。

02

豆包


豆包,大模型加Agent,更关注商业应用的需求发展。
1)模型也走向视觉。

2)相对智谱,豆包更强调基础应用的基础上,为三方应用提供能力,做商业发展:

3)强调对话能力


03

Google


Google最近发布了Gemini 2.0,体现的也是模型的视觉能力,和agent支持能力。

有意思的是,在今天豆包的发布会开始有一段视频,和google发布的视频体现的能力类似,但说实话,豆包应用的表现感觉更好一些。

04

综合分析


上述三家公司,充分体现出两个特点:
1) 模型竞争从文本走向视觉
2)基于Agent的竞争是当前重点

两个比较

  1. 厂商比较

每个厂商在选择商业路线的时候,会依据自身情况做选择。智谱作为一个新兴公司,缺少生态支持,所以他选择具体深挖的场景,卖场景应用,是非常合理的选择。
而豆包依托字节的巨大用户群及长期的生态发展,采用云的方式,提供模型能力,为企业提供服务,则是更理想的选择。同时,豆包APP服务广大个人用户,是个更好的商业选择。这一点智谱是做不到的。但在具体的应用场景上,智谱走的更深更远(据说可以规划动作到53步),这一点豆包当前是没有做到的。二者各有千秋。

Google拥有和豆包一样,甚至更多的生态及基础设施资源,所以,Google和豆包实际上是在一条路线上竞争。

相对来说,微软和AWS则是不完善的竞争,二者都采用投资模型公司的方法而不是自研模型,微软投了openai,AWS投了Claude,但模型和应用的分离,很可能会导致这两个巨头后边的落后。

Claude也出了AI PC,从这一点上,Claude和智谱差不多是一个量级,也是同一种发展路线。

唯一不同的是,Claude有自己的发展路线,同时要兼顾AWS的要求,Openai也是一样的问题,这种兼顾,未来不知道是好还是坏。一方面发展会受到制约,另一方面,这些大厂确实会带来不菲收入。且走且看。

2. 中美比较

几乎所有人都认为,在大模型的领域,美国还是领先的。

就我个人感觉,在模型能力上,国外的,确实好用一些(只是感觉,无其它根据)。

但在应用上,我感觉,中国已经不差了。

更大的差距可能还在GPU,及其之上的训练软件,这块,还得奋起直追。

05

冲击波


大模型的竞争力已经实实在在地表现出来,竞争刚开始,还很难判断哪家公司好,哪种路线好。

但对其它行业的冲击很快就出现了。

简单的,类似海报这种东西,已经自动生成了,靠这行吃饭的怎么办?

复杂的,以智谱为例,它可以通过APP订机票,那么,在积累一定的用户后,它直接把航空公司接入,很难吗?这个时候,那个订机票的APP怎么办?

得入口者得天下,AI正在抢占入口。

人是无法直接与机器交互的,手机,PC上的很多软件,起到了人与机器交互媒介的作用,而AI可以直接与机器交互,还需要媒介吗?
或许,每个行业都该考虑一下,AI会给我带来什么冲击?


END


AI与安全
理清逻辑,找到规律,看清趋势。作者前华为云高级安全专家,现为独立顾问。
 最新文章