AI观察20240709:Scaling Law、Robotaxi、WAIC与应用

文摘   科技   2024-07-15 17:40   上海  
关注共识粉碎机,获取历史讨论会纪要

AI观察系列是共识粉碎机与久谦咨询的共创研究项目,除了在公众号内定期更新的内容外,企业客户可以联系文底久谦销售同事试用和采购以获得更多服务和详细资料。

内容较久谦官方小程序会有一周不等的延后,也会根据实际情况有部分删改。

1 Scaling Law:Anthropic访谈与Robotaxi看到的


最近有两则关于AI的重要消息,既与投资密切相关,又影响着整个人类社会的未来。首先,Anthropic的CEO Dario透露,目前公司正在开发的AI模型训练成本高达10亿美元。他预计,到2027年,AI模型的训练成本将上升至100亿美元,甚至是1000亿美元。其次,Dario的前东家百度(没错,Dario的AI之路始于百度)的萝卜快跑Robotaxi在武汉实现了500万订单,公司希望2024年将在武汉实现盈亏平衡,并在2025年实现盈利。

当然细看Robotaxi模式还有很多问题,包括其后台成本昂贵,就算不考虑总部自动驾驶软件的研发费用,还要考虑无人车运营中心的投产与折旧,安全员成本。以及Robotaxi目前的空跑比例还远高于其他网约车服务,特别空跑还会间接影响到折旧年限,目前商用车都有严格的公里报废要求。

毫无疑问,我们正处于人类社会又一个伟大的变革点上。人工智能和通用人工智能(AGI)的研发,就像曼哈顿计划和阿波罗计划一样,已经成为高投入、大规模、有组织的科研项目。幸运的是,我们团队同全球顶级的AI专家和科学家们长期保持着深入交流,能够在最前线见证人类文明不断突破智能的边界。虽然基于transformer的Scaling Law是否能引领我们走向AGI的终点尚不确定,但与这些前沿专家的交流,总能感受到他们面对挑战时的积极与乐观。

继续推进Scaling Law仍有许多前景广阔的研究思路和方法,每种思路和方法的验证都需要巨大的算力,往往需要数万甚至数十万张GPU来进行实验和训练。人类进化出智能是数亿年对抗熵增的过程,消耗了无数能量。通过Scaling Law追求大模型,也是利用海量算力来对抗熵增。这不仅需要单卡层面的优化,更需要整个大集群乃至数据中心的优化,而互联Networking技术则是其中的核心环节。Scaling Law能否继续,核心之一在于互联Networking。正因为如此,我们之前重点分析了互联技术的机会与挑战。

另一方面,曼哈顿计划和阿波罗计划产生了许多副产品,被广泛应用于人类社会的日常生活中,创造了巨大的经济价值,如核能发电、放射性治疗、计算机技术、微波技术、材料科学等。在通往AGI的道路上,我们相信也会有许多副产品,可能更快、更直接地创造巨大的社会价值。当前最明显的例子是自动驾驶和端侧AI。以Tesla为代表的自动驾驶技术,受到大模型的启发,升级为端到端的架构,结合海量高质量的RLHF人类真实驾驶数据,已经呈现出清晰的Scaling Law。我们相信,Tesla的V12及后续不断迭代的算法,以及类似Waymo和百度的Robotaxi,在可预见的将来,会实现L4级别的真正落地。而与自动驾驶软硬结合类似,手机作为人类最常用的硬件产品,拥有最全面的个人使用习惯,是不可替代的入口。以苹果和谷歌为代表的端侧AI,也可能在可预见的未来,成为每个人的Personal Agent。我们的下一份重点研究报告将聚焦端侧AI,欢迎大家关注。


2 WAIC与AI应用:Workflow与定制化是集中度最大的敌人


上周逛了下WAIC,然后参加了几场投资人与创业者的茶话会。

听到了很多精妙的想法,每个想法都很细致,这个XX行业+AI怎么做的,为了完成这个工作流程,分成了几个Agent,在哪些环节里加了AI,哪些环节做成决策树,哪些环节用Bert。

最近我做AI客服项目的时候也是一样的感受,聊了大量的美国和中国客服案例,也是极尽符合客户公司的需求,特别细致,特别需要行业理解。

最近有个OnlyFans案例挺火的,虽然有点敏感,但我感觉很代表实际的应用落地情况。具体的情况大家自己去看吧:https://www.latent.space/p/nsfw-chatbots

在这个案例里就很典型,客服不是简单的客服,需要聊骚,还要符合人设,给每位大V精调模型。还要根据大V的内容挑选亮点,去匹配用户的行为习惯,甚至在互动的过程中也有很多小心思。

在一些销售的Agents案例里也看到类似的,要区分Leads的ABC等级,衡量哪些人做,哪些AI做。Leads还要分成T+0,T+1的差别,根据事实的SFT反馈回滚。针对当天用户、7日留存用户、复购用户,还要开发不同的Agent。

这些想法给我的感受是太精妙了,也是因为太精妙了,导致行业的KnowHow非常重要,多数需要行业里面的人来做,靠外部标准化公司很难完成,行业集中度短期没法提高。

这也和我与IT咨询公司沟通感受很像,在帮助客户部署的环节也需要很长很长时间。IT咨询公司也要学习,客户也要学习,还要帮助客户使用他们的本地数据。过去的人力弹性体系在如今的高门槛要求下也失效了,大家都很难找到合适的能够参与部署的人。


3 最后讲一下盘面


Long Semi Short Software的Degross结束了,美国PM回来上班了,开始Regross了。看盘面就能明显感觉到了,独立日那一整周大家都在放假。

但这种板块轮动感觉这个季度会挺频繁的,特别是看这个季度的应用季的情况。如果微软对Copilot有很好的口风,其他应用也有好口风,可能还会再反复出现。



我们正在发售一篇报告,其内容是:

  • META与MSFT季度调研情况与业绩分析(下周可约路演)

尚有三篇报告正在调研中,其内容是:

  • AI客服的进展与影响

  • AI手机以及Personal Agent场景

  • AI咨询行业

在过去的四个月,我们已经发售了六篇报告:

  • 算力需求场景测算

  • AI与GPU在META中的应用

  • 微软Copilot进展、GenAI售卖场景以及如何影响公有云选择

  • 北美算力租赁厂商近况及供需平衡情况

  • 互联技术以及未来发展趋势

  • 国数据中心与电力情况

除了报告外,我们也承接定制化的投研需求。

对报告感兴趣,有定制化投研需求,或者对我们的日常调研纪要(每月超过50篇AI调研纪要)感兴趣的请联系下面的久谦销售同事,或者点击共识粉碎机底栏菜单页的投研服务:



大模型未来三年的十个假设


Data Infra:大模型决战前夜

共识粉碎机
寻找与共识的不同
 最新文章