首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

你的Kimi在做数学题，新一代数学推理模型k0-math正式发布！

科技 2024-11-27 10:11 北京

Kimi数学模型正式上线！

里

作者丨不寒

编辑丨刘欢

常用Kimi网页版的小伙伴们可能已经发现，你今天打开的时候，左边好像多了什么东西。

Kimi数学版已经正式上线！

你可以轻轻点击侧边栏的“眼镜”图标，进入k0-math模型驱动的Kimi数学版界面！看到他们的数学版最新slogan，“基于 k0-math 模型，用公式勾勒世界”。

当前Kimi数学版已上线网页版，官方表示，后续会推出手机版，进一步拓宽用户群体的使用场景，无论是中学生、高校学生还是科研人员，都能在手机端随时随地使用Kimi数学版来辅助学习和研究。

月之暗面于11月16日发布了新一代数学推理模型 k0-math，官方昨日宣布基于该模型的 Kimi 数学版上线！

k0-math的最大亮点在于其采用了强化学习和思维链推理两项核心技术。

k0-math模型融合了前沿的强化学习与思维链推理技术，模拟人类解题时的思考与反思机制，大幅提升了解决数学难题的能力。

强化学习是一种基于奖励机制的学习方法，通过不断尝试和错误，模型能够在复杂环境中优化其决策过程。

在k0-math的应用中，强化学习被用来训练模型在解题过程中做出最优决策，尤其在处理复杂数学问题时表现出色。

与此同时，k0-math还引入了思维链推理技术。通过模拟人脑的思维过程，将问题拆解成多个步骤，逐步推导出答案。

思维链推理能帮助模型更好地理解问题的结构，还能通过反复推敲来提高解题的准确性。

数学基准能力表现出色，媲美OpenAI-o1?

月之暗面科技有限公司的创始人杨植麟提出k0-math模型在数学能力上对标OpenAI的o1系列模型。

官方提到k0-math在多项数学基准能力测试中表现出色，其数学能力足以与OpenAI的o1系列模型相媲美。

在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中，k0-math的成绩超越了o1-mini和o1-preview模型。

此外，还提及k0-math在解题过程中会花费更多时间进行推理，包括深入思考和规划解题思路，在必要时进行自我反思和改进，提高答题的成功率。

但不知道比起马斯克的大模型如何？xAI的Grok-3可是在上上周声称成功证明了“黎曼猜想”。

局限性：离创造性的解决方案还有一定距离

最近不知道大家有没有发现，AI模型都争着抢着挑战高考数学、考研数学……

数学的魔力……真大。

话说回来，尽管k0-math在数学推理上取得了巨大进步，但它仍有局限性，也就是面对高考数学的难题，k0-math也存在一定概率的错误解答……

它暂时无法解答LaTeX格式难以描述的几何图形类问题，且在处理过于简单的问题时可能会过度思考。

Kimi团队表示，将继续优化k0-math模型，以期在未来能够更好地服务于数学教育和研究。

AI的解题过程虽然可以模拟人类的思维链推理，但如何将其转化为具有创造性的解决方案，仍然是一个待解的难题。

除此之外，AI模型一步一步蔓延到教育、数学，是否将来将完全颠覆传统教育逻辑？

但如果学生过于依赖AI工具，是否会导致他们缺乏独立思考的能力？

随着AI逐渐能够应对更多的学科和领域，如何保证AI的使用公平、合理，并确保它不被滥用？

AI的发展喜闻乐见，但AI的伦理边界，大家是否还在关注？

推荐阅读

END

http://mp.weixin.qq.com/s?__biz=MzA5NTI1MDEyNA==&mid=2652719154&idx=1&sn=43d85fdc292c8ebfd08f07bec23c559d

科技与产业创新服务平台

最新文章

立足长远，拼多多放缓脚步，将视野投向长期价值

直击美团三季报：营收936亿元，核心本地商业增长20%，新业务亏损收窄

外卖鼻祖，一折卖了

鹿明机器人获天使轮融资，创始人曾任追觅科技高管

智谱Openday：打工人的私人助理上线，人机交互范式走向新的阶段！

揭秘：马斯克与OpenAI的恩怨始末！

谷子经济爆火：不结婚的年轻人，在毛绒世界里过家家

打工人，年年买不起羽绒服？

刚刚： OpenAI白嫖惹众怒，转身又宣布了 15 亿美金的融资！

你的Kimi在做数学题，新一代数学推理模型k0-math正式发布！

挑战3C霸主？电纸书还挤不上主流“牌桌”

你买的鞋呢？卖了！钱呢？又买鞋了。那鞋呢？又卖了！钱呢......

AI眼镜，这次真撕掉了“电子垃圾”的标签？

新一轮裁员10%、明星业务下滑，Keep再遇寒冬

首款全彩双目光波导分体式AI+AR眼镜正式问世！

日进180亿元，“三桶油”线下抢桩

净利率暴跌，金融IT海外求生？神州信息VS长亮科技财报解析

杨歌Gary：特朗普胜选后的格局剧变

智能戒指Oura获投7500万美金，扎克伯格也是用户

亲民且开源！阿里推理模型Marco-o1震撼发布！

重磅！单做AI搜索不够，OpenAI要开发浏览器！！趁机火拼谷歌！

拼多多发布Q3财报：营收994亿元，同比增44%；净利润250亿元，同比增长61%

AI搜索：技术与商业的“双面棋局”，要革小红书的命？

百度Q3财报：净利润增17%超预期，文心大模型日调用量增30倍达15亿

WIM2024创新者年会榜单征集评选开始了！

钟睒睒把自己“逼”到了企业家直播的对立面

AI界的拼多多又来整活！deepseek全新上线R1-Lite预览版！

英伟达发布最新Q3财报，净利润同比增长109%！但股价却跌了？

快手发布2024年Q3炸裂成绩单：利润31.19亿元，同比大增41.1%，电商GMV达3342亿元

钟首富，初遇滑铁卢

60岁掌门人重返一线，过气奶茶香飘飘陷入迷途

女首富宗馥莉，搞不定“无糖”，如何续写自己的新故事？

“减肥神药”暴利生意经：马斯克“代言”，两巨头今年已赚1196亿元

中国年轻人不爱保时捷了

过气网红，夜店再就业

苹果减产、华为“难产”，平替者强势入局，头显真凉了？

拥挤的智能AR眼镜赛道，行业老炮Rokid再战产业新兵

“AIGC第一股”跌成“最惨AI股”，出门问问投资者巨亏数千万

银河通用获5亿元战略轮融资，探索多场景商业化落地

真的假的？马斯克大模型搞定黎曼猜想？

阿里巴巴2025财年Q2财报出炉：营收2365亿元，净利润增长63%，淘天集团营收989.9亿元

联想业绩暴增背后，ISG业务仍拖后腿，亏损超5亿元

京东发布2024年Q3财报：营收2604亿元，经营利润120亿元，启动50亿美元新回购计划

80后Keras之父从谷歌正式离职！谷歌两位重量级VP联名感谢！

大佬喊话，AI寒冬已来？

灵宝CASBOT首款人形机器人产品—CASBOT 01发布，通用类脑智能机器人瞄准多场景落地

双十一，那个消费狂欢时代结束了

具身智能“投资热”仍在持续，高瓴创投、蓝驰创投领投具身智能创企

百度世界大会，李彦宏甩不出“王炸”！

赛程近尾声，谈谈第16个“双十一”的三大看点

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉