数学推理能力超o1,kimi的数学推理模型它要来了!

创业   2024-11-17 22:22   广东  

作者子川

来源AI先锋官


kimi的最新模型,它要来了!
在11月16号下午,也是Kimi面向全社会开放服务一周年之际,kimi宣布推出它们新一代数学推理模型 k0-math
此次数学推理模型k0-math直接对标 OpenAI o1的 o1-mini 和 o1-preview 。
在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中,k0-math 初代模型取得的成绩已经完全超越 o1-mini 和 o1-preview 模型。具体数据如下图所示:
同时在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中, k0-math 初代模型的成绩分别达到了 o1-mini 最高成绩的 90% 和 83% 
k0-math在解数学题上会和目前市面上的模型有稍不同。不仅思考时间会更长,同时解题过程中会列出多种解题方法,最后反复验证,才会给出准确答案。

就像这样式的。

就连简单的1+1,它也会给出好几个解题过程,最后才会给出答案“1+1=2”。
同时k0-math 模型还不能解答 LaTeX 格式难以描述的几何图形类问题。
大家会喜欢这样准确性更高同时解题时间更长的交互吗?

除了发布 k0-math以外,Kimi 探索版也将上线更多具有推理能力的功能。
意图增强:将抽象的问题和模糊的概念具体化,去理解用户的真实需求。比如用户提问“某产品的用户忠实度”,Kimi 会把“用户忠诚度”这个模糊的问题转发为具体的“活跃度、留存率、使用频率和时长”等维度分析用户的忠实度。
信源分析:在搜索回答来源时,先会进行一轮筛选,筛选出更具权威性和可靠的信息源,并且可以在答案中一键定位信源具体的出处。
链式思考:基于 COT 思维链处理能力,对问题进行逐步的链式拆解。
比如:当营销人员在选择广告平台时,想要了解“有哪些社交媒体广告平台,哪个最有效”。
Kimi会首先拆解这个问题,列出主要的社交媒体广告平台,然后分别搜索每个平台的优势、用户群体和适用场景,最后分析整合这些高质量的信息,推荐一个最适合不同需求的广告平台及其理由。

k0-math模型和更强的Kimi探索版,未来几周就将分批陆续上线Kimi网页版和Kimi智能助手APP,大家可以浅浅期待一下。



 .END.
扫码邀请进群,我们带你一起来玩转ChatGPT、GPT-4、文心一言、通义千问、讯飞星火等AI大模型,顺便学一些AI搞钱技能。



往期文章回顾


AI先锋官
AIGC大模型及应用精选与评测
 最新文章