11月30日,智谱开了GLM-PC的发布会,12月18日,火山开了豆包的发布会,结合这一段美国公司的一些动向,一起看看。
本文简单比较智谱,豆包,Google的情况,并在此基础上,分析原因,动机及未来发展,也包含其它厂商的一些比较。
智谱
智谱,模型与应用协同的agent,在部分领域深入挖掘应用场景
1)模型向视觉发展
2)Agent开始实用
在发布会上,智谱的AI能够控制手机,控制PC,完成一些日常工作生活里的场景,包括处理工作,发红包,完成购物等,都是在解决很具体的场景需求,实现真正的助理能力。
3)模型向小,向终端发展
智谱的模型小型化,向终端发展,也表现出一个非常具体的方向。与荣耀手机的合作是非常具体的场景。
简单说,智谱的发展,是在垂直领域解决问题,深入。
豆包
豆包,大模型加Agent,更关注商业应用的需求发展。
1)模型也走向视觉。
2)相对智谱,豆包更强调基础应用的基础上,为三方应用提供能力,做商业发展:
3)强调对话能力
Google最近发布了Gemini 2.0,体现的也是模型的视觉能力,和agent支持能力。
有意思的是,在今天豆包的发布会开始有一段视频,和google发布的视频体现的能力类似,但说实话,豆包应用的表现感觉更好一些。
综合分析
上述三家公司,充分体现出两个特点:
1) 模型竞争从文本走向视觉
2)基于Agent的竞争是当前重点
两个比较
厂商比较
每个厂商在选择商业路线的时候,会依据自身情况做选择。智谱作为一个新兴公司,缺少生态支持,所以他选择具体深挖的场景,卖场景应用,是非常合理的选择。
而豆包依托字节的巨大用户群及长期的生态发展,采用云的方式,提供模型能力,为企业提供服务,则是更理想的选择。同时,豆包APP服务广大个人用户,是个更好的商业选择。这一点智谱是做不到的。但在具体的应用场景上,智谱走的更深更远(据说可以规划动作到53步),这一点豆包当前是没有做到的。二者各有千秋。
Google拥有和豆包一样,甚至更多的生态及基础设施资源,所以,Google和豆包实际上是在一条路线上竞争。
相对来说,微软和AWS则是不完善的竞争,二者都采用投资模型公司的方法而不是自研模型,微软投了openai,AWS投了Claude,但模型和应用的分离,很可能会导致这两个巨头后边的落后。
Claude也出了AI PC,从这一点上,Claude和智谱差不多是一个量级,也是同一种发展路线。
唯一不同的是,Claude有自己的发展路线,同时要兼顾AWS的要求,Openai也是一样的问题,这种兼顾,未来不知道是好还是坏。一方面发展会受到制约,另一方面,这些大厂确实会带来不菲收入。且走且看。
2. 中美比较
几乎所有人都认为,在大模型的领域,美国还是领先的。
就我个人感觉,在模型能力上,国外的,确实好用一些(只是感觉,无其它根据)。
但在应用上,我感觉,中国已经不差了。
更大的差距可能还在GPU,及其之上的训练软件,这块,还得奋起直追。
冲击波
大模型的竞争力已经实实在在地表现出来,竞争刚开始,还很难判断哪家公司好,哪种路线好。
但对其它行业的冲击很快就出现了。
简单的,类似海报这种东西,已经自动生成了,靠这行吃饭的怎么办?
复杂的,以智谱为例,它可以通过APP订机票,那么,在积累一定的用户后,它直接把航空公司接入,很难吗?这个时候,那个订机票的APP怎么办?
得入口者得天下,AI正在抢占入口。
人是无法直接与机器交互的,手机,PC上的很多软件,起到了人与机器交互媒介的作用,而AI可以直接与机器交互,还需要媒介吗?
或许,每个行业都该考虑一下,AI会给我带来什么冲击?
END