智能周报|一些市场拐点

财富   2024-12-22 22:37   上海  

撰文 | 新皮层小组

编辑 | 吴洋洋

2024年很快就要结束,我们大概率等不到GPT-5了。

连续12天的马拉松式发布会收官,OpenAI一个大更新都没有。而《华尔街日报》进一步爆料称,GPT-5已经至少训练了2轮,每次长达数月,但每次训练结果都不令人满意。

这和OpenAI前首席科学家Ilya Sutskever一周前在NeurIPS 2024大会上的说法一致——预训练时代结束了,单纯靠投喂更多数据、扩大模型参数的「预训练」,已经不足以有效提升模型能力了。

这些消息对创业公司(比如Kimi)来说不是什么好事,对大公司(比如字节)则是个好消息——它们可以有更多时间利用其资源优势赶超效率更高的初创公司了。

本周,Kimi和字节又是前后脚发布了其在视觉理解领域的类o1模型,前后仅相差两天。孕育了这一拨AI技术浪潮基座Transoformer、却因动作缓慢没能第一个把ChatGPT做出来的Google,本周也透露了一个推理模型。

技术放缓后,连初创公司的融资都变少了。本周,智谱宣布完成一轮30亿元融资,同时还声称其2024年的收入翻倍了,为市场打气。MiniMax和Kimi宣布上一笔融资的时间分别是今年3月和8月。

自动驾驶领域,同样出现了一些里程碑式事件。其一是百度造车项目彻底告终,而华为的智驾系统则开始进入合资车型,此前,它虽然后来居上从百度自动驾驶手中抢走不少项目,但那些都还是国产品牌。

以下内容由「新皮层」团队制作,欢迎关注。


Key Points

大模型


Ilya称预训练时代结束;


月之暗面发布K1模型,能进行「视觉思考」;


张楠卸任抖音CEO后首露面,为即梦站台;


CMU等机构联合发布机器人仿真平台Genesis;


Google也有推理模型了,暂时叫Gemini 2.0 Flash Thinking Experimental;

机器人与自动驾驶


智元机器人量产,订单有700台;


Waymo首次出海,将在东京试运营数个季度;


华为智驾搭载一汽奥迪A5L,首次进入合资车型;

投融资与公司动态


「通义」应用团队从阿里云分拆,加入夸克所在事业群;


爱诗科技融资近3亿元;


除了字节和腾讯,苹果也在与智谱谈判使用其大模型;


Perplexity融资5亿美元,还收购了企业搜索公司Carbon;


智谱宣布30亿元融资,2024年收入翻倍;


AI代码助手Cursor又融了1亿美元,估值飙升至25亿美元。


大模型


Ilya称预训练时代结束

12月14日,前OpenAI联合创始人、SSI创始人Ilya Sutskever在NeurIPS 2024大会上表示,预训练作为AI模型开发的第一阶段即将结束。该阶段,AI训练依赖于从大量未标记数据中学习模式,而这些数据通常来自互联网、书籍等来源。Ilya表示,现有的可利用训练数据已经达到峰值,「我们只有一个互联网,必须适应现有的数据资源」。



月之暗面发布K1模型,能进行「视觉思考」

12月16日,月之暗面发布「视觉思考模型」k1,支持端到端的图像理解——模型能够直接处理用户输入的图像,不需要借助外部的OCR或额外的视觉模型。另外,k1模型的后训练采用强化学习技术,具有「推理」能力。也就是说,用户可以把题目拍下来发给Kimi,它会给出具体的答题步骤。1个月前,月之暗面发布了数学推理模型k0-math。月之暗面称,除了解答数学、物理、化学等基础学科问题,k1模型还具备一定的通用能力,例如可根据一份科学家的手稿照片,推理手稿的内容和背景故事。



张楠卸任抖音CEO后首露面,为即梦站台

12月18日至19日,字节跳动在火山引擎Force冬季大会上公布了AI模型和应用层的多项更新。其中包括一款类o1模型的视觉理解模型和一个3D视频生成模型,同时,最新更新中,即梦开始能控制图片中的文字生成,成为国内首个能在图像中生成文字的大模型产品。



CMU等机构联合发布机器人仿真平台Genesis

12月19日,CMU联合18个科研单位发布机器人仿真平台Genesis(意为「起源」)。机器人仿真平台提供了一个虚拟环境,可以让研究者在开发、验证机器人算法时,不需要真实部署一个机器人。Genesis的创新之处在于,它将各种物理求解器(Physics Solvers)统一到了一个框架中,包含了模拟不同类型物体和现象的多种方法。另外,它还结合了生成式AI技术,让创建模拟世界自动化。



Google也有推理模型了,暂时叫Gemini 2.0 Flash Thinking Experimental

12月20日,Google DeepMind团队推出新的推理模型Gemini 2.0 Flash Thinking Experimental,能够在回答用户提问时提供回答背后的逻辑,适用包括编程、数学和物理等领域的复杂问题。该模型基于Google本月新近发布的Gemini 2.0 Flash模型开发,但没有披露具体的技术信息。新的推理模型可能与Google本月推出的「深度研究」(Deep Research)功能有关。在发布Gemini 2.0系列模型时,Google推出了「深度研究」,该功能让Gemini 2.0模型在数分钟内不断搜索网页,根据这些信息完善分析结果,而后开始新的搜索,多次重复搜索和分析的过程后最终形成报告。


机器人与自动驾驶


智元机器人量产,订单有700台

12月16日,智元机器人宣布,旗下机器人实现规模化量产,从初创阶段迈向产业化阶段。截至发布时,智元机器人的累计产量已达962台,其中700台为订单需求,200余台为智元自用,到年底计划产量将接近千台。

目前,智元生产的机器人主要包括双足机器人和轮式机器人,今年出货量中双足机器人占比过半。这一数据超过了此前公司对外披露的规模。据今年8月召开的发布会,智元预估2024年发货量在300台左右,其中双足机器人200台左右、轮式机器人在100台左右。



Waymo首次出海,将在东京试运营数个季度

12月16日,Google旗下自动驾驶公司Waymo宣布将于2025年年初在东京测试其无人驾驶出租车,这是该公司首次在美国本土以外尝试开展业务。Waymo将与日本最大的出租车运营商「日本交通」和出租车应用程序GO合作,开始在东京的街道上测试其全新的捷豹I-PACE车型。「日本交通」将负责车辆的管理和维修,并在项目启动阶段派遣司机手动驾驶Waymo车型熟悉东京路况。和采取右侧通行制的美国不同,日本实行左侧通行制,这或将对Waymo造成挑战。



华为智驾搭载一汽奥迪A5L,首次进入合资车型

12月19日,一汽奥迪A5L在街头的实车图在网上传出。这是一汽奥迪首次搭载华为智驾的车型,亮相于11月的广州车展,将于2025年上市。对于华为而言,这也是其智驾方案首次上车合资车型,且为纯燃油车。实际上,奥迪A5是奥迪A4的换代车,但奥迪更改了车型名称中的数字序号。这是因为奥迪从2024年起设立了新的产品命名规则——偶数代表电动车型,奇数代表燃油车型。因此,已有产品会按照新规则被整合到新的产品序列中,例如A4更名为A5,A6更名为A7。


投融资与公司动态


「通义」应用团队从阿里云分拆,加入夸克所在事业群

12月18日,有报道称,阿里旗下的AI应用「通义」近期从阿里云分拆,并入阿里智能信息事业群,而通义面向B端市场的部分、通义实验室仍在阿里云体系内。调整后,通义PC端及App团队与智能搜索产品「夸克」平级。拆分意味着「通义」的底层技术与产品应用团队将自此分离,字节、百度的大模型技术和应用早在去年就已分离。据QuestMobile的数据,工具类AI应用运营指标中,通义今年6月的活跃率(DAU/MAU)为14.3%,月人均使用天数为4.3天,两项数据均位列第4,落后于豆包、文心一言等。报告还显示,通义月卸载率高达62%,几乎是文心一言的两倍。



爱诗科技融资近3亿元

12月18日,视频生成大模型公司爱诗科技宣布完成A2至A4轮融资,总金额近3亿元,投资方包括蚂蚁集团、北京市人工智能产业投资基金、国科投资及光源资本。爱诗科技成立于2023年4月,于2023年8月和今年3月分别完成了数千万元天使轮融资和亿级A1轮融资。目前,公司的AI视频生成产品PixVerse具备文生视频、图生视频、视频生视频功能,主要面向C端市场,全球用户数超1200万,月活跃用户数近600万。本月,PixVerse移动端App在海外上线,模型V3.5版本也进入内测阶段,生成耗时可缩短至30秒以内。



除了字节和腾讯,苹果也在与智谱谈判使用其大模型

12月19日,消息称苹果也在与智谱就在华版本的iPhone中使用其大模型进行谈判。这使得目前在与苹果就同类事宜谈判的中国大模型公司增加至4家。路透社12月19日午间消息称,苹果正在与腾讯和字节谈判相关合作。谈判处于早期。金融时报此前称苹果也与月之暗面接触过。



Perplexity融资5亿美元,还收购了企业搜索公司Carbon

12月19日,有报道称,AI搜索公司Perplexity本月早些时候完成了今年的第4轮融资,规模为5亿美元,公司估值达到90亿美元,是年初的17倍多。此轮融资由Institutional Venture Partners领投,英伟达、New Enterprise Associates、B Capital和T Rowe Price等机构参投。

12月18日,Perplexity还宣布收购美国的一家小型初创公司Carbon。Carbon主要从事检索增强生成,该技术允许大语言模型在生成答案之前访问外部数据库的信息。此次收购表明Perplexity开始进入企业搜索领域,可能即将推出把大模型与企业数据库链接的AI搜索产品。



智谱宣布30亿元融资,2024年收入翻倍

12月17日,智谱宣布完成新一轮30亿元融资。新投资方包括多家战投及国资,君联资本等老股东跟投。智谱称,本轮融资将用于智谱GLM大模型系列的进一步研发,从回答问题到解决复杂推理、多模态任务,更好地支撑行业生态发展。智谱没有公布该轮估值。这是智谱今年宣布的第二轮融资。今年9月,中关村科学城公司宣布领投智谱,对后者估值200亿元。智谱称,其业务在2024年保持了高速增长,商业化收入增长超过100% 。其中C端产品智谱清言App用户数超过2500万,年化收入(ARR)超千万元;MaaS平台bigmodel.cn的API年收入同比增长超过30倍,日均Tokens消耗量增长150倍。



AI代码助手Cursor又融了1亿美元,估值飙升至25亿美元

12月19日,有报道称,AI代码助手Cursor的开发公司Anysphere完成1亿美元B轮融资,投后估值达25亿美元。本轮融资由老股东Thrive Capital领投,Andreessen Horowitz(a16z)等知名机构参投。距离其4个月前完成6000万美元A轮融资(估值4亿美元),估值已飙升6.5倍。

Cursor在竞争激烈的AI代码助手市场中脱颖而出,与微软的GitHub Copilot等产品形成直接竞争。其年化经常性收入(ARR)从今年4月的400万美元增长至10月的4800万美元。Cursor通过「免费+订阅」模式变现,每月订阅费用从20美元到40美元不等,OpenAI、Shopify、Instacart等公司都是其客户。


-END-


第一财经YiMagazine
这里是《第一财经》杂志(前身《第一财经周刊》)读者俱乐部,我们为你发掘精彩的商业价值,也邀请你一起探寻明亮的商业世界。
 最新文章