月之暗面发布数学大模型,对标OpenAI o1

创业   2024-11-20 21:09   上海  

图片来源:视觉中国


中国人工智能正在快速追赶OpenAI。


11月16日下午,中国通用人工智能公司月之暗面宣布:发布数学大模型k0-math。这是该公司首次推出推理能力强化模型产品。


按照该公司的说法,k0-math的数学能力可对标全球领先的OpenAI o1系列可公开使用的两个模型o1-mini和o1-preview。


具体而言,在业界最常使用的数学能力基准测试MATH中,k0-math模型得分93.8分,超过o1-mini的90分和o1-preview的85.5分。k0-math这一成绩仅次于o1完全版的94.8分。


需要注意的是,k0-math模型虽然擅长解答大部分有难度的数学问题,但是当前版本还无法解答难以描述的几何图形类问题。


此外,这款产品还有一些局限性需要突破,包括对于过于简单的数学问题,例如1+1=?这类问题时k0-math模型可能会“过度思考”,回答出一些偏离常识的答案。


月之暗面创始人杨植麟在回答《财富》的问题时表示:对于强化学习而言,“数据”是一个核心问题,如果未来能够把大模型的奖励机制做好,将会避免不必要的“过度思考”。“我们现在没有答案的长度做任何的限制,让人工智能自由的思考,也许可以通过改变奖励结构的方式,抑制过度思考,这是我们接下来想去解决的问题。”他说。


月之暗面是中国估值最高的人工智能大模型公司之一。


Kimi智能助手则是月之暗面旗下的核心产品,目前它拥有3,600万用户。据阿里财报披露,阿里巴巴在2024财年投资8亿美元,购入月之暗面36%股权,可知彼时月之暗面估值约22亿美元。今年5月,腾讯、高榕资本等新资方加入,这也推动了月之暗面估值超过30亿美元。


31岁的杨植麟毕业于清华大学,并获得美国卡内基梅隆大学计算机博士,他曾在Meta AI和Google AI研发团队工作。


在过去一年,Kimi经历了高速增长。


由于Kimi支持200万字的无损上下文输入,在文本解析和长文本处理方面表现出色。这一优势使其在阅读理解、文献分析、长文写作等任务上具有独特优势。2024年4月,Kimi智能助手网页版访问量达到2,004万,较上月上涨60.2%,访问量超过百度的文心一言。


当下,中国基础大模型公司竞争激烈,包括腾讯、百度、阿里巴巴以及字节跳动在内的各个公司都推出了大模型产品。


在竞争版图中,字节跳动旗下产品“豆包”正在成为Kimi最可怕的竞争者。


11月初,在AI产品榜(aicpb.com)的全球总榜(App)上,豆包位列第二,仅次于ChatGPT。年初至今,豆包的累计下载量已经突破1亿。就中国而言排名前三的分别是豆包与百度旗下的文小言以及Kimi,月活跃用户数均超千万。


在回应与豆包的竞争时,杨植麟表示,他并不太关注竞争本身。“因为竞争本身不产生价值。”他说,“只有推出更好的技术和产品,才能给用户创造更大价值,这是我们现在最核心的问题。”


杨植麟最为关注的数据是用户留存率。他认为现在Kimi仅仅达到通用人工智能的初级阶段,用户留存率这一指标与技术成熟度正相关,随着技术不断提升,kimi的用户留存率会自然提升。他并没有正面回答现在kimi的用户留存率为多少,只表示这个数据的提升需要“永无止境”。


不过,《财富》对话的多位投资人以及Kimi竞争对手均表示,目前并未体验到k0-math产品,对其功能和实际效果无法给出评价。


Kimi不断推出新产品反映了中美人工智能领域的竞争。业界普遍认为,人工智能主要由算法、算力和数据三大要素组成,在算力层面,美国拥有绝对优势;在算法层面,中国公司正在逐步追赶;而在数据和应用场景层,中国拥有将人工智能应用到各个场景中,并获得有效使用数据的能力,这是一大优势。(财富中文网)

在财富Plus,网友们对这篇文章发表了许多有深度和思想的观点。一起来看看吧。也欢迎你加入我们,谈谈你的想法。今日其他热议话题:

查看《上海取消普通住房和非普通住房标准》的精彩观点
查看《字节跳动最新估值约3000亿美元》的精彩观点

推荐阅读

财富FORTUNE
财富中文网,集世界500强韬略,铸中国商界精英
 最新文章