首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
国产AI,两强初现
财富
2024-11-25 22:59
上海
“宇宙这本书是用数学语言写成的,除非你首先学懂了它的语言,否则这本书是无法读懂的。”如果万物皆数,这种强化学习带来的推理能力的提升,未来将会泛化到更多日常任务上。
近日,月之暗面Kimi发布新一代强化模型k0-math,也是国内首个对标OpenAI o1模型的强化推理大模型,发布时间就在o1-preview推出的2个多月后。
从今天起,该数学推理模型已经上线网页版,用户可以拿数学难题去考验AI的解题能力。Kimi相关负责人表示,该模型在做了大量的数学思维训练之后,不仅会做数学题,还具备了极强的综合逻辑思维能力,面对非数学问题,也可以给出自己的思考。
Kimi不只学会了数学
k0-math模型采用了创新的强化学习和思维链(CoT)技术,这让Kimi学会了数学,并且在美国竞赛题、中国⾼考、考研等场景下可与o1模型媲美。
所谓思维链(CoT),就是模拟人脑,把一个复杂的问题拆解为若干子问题,让大模型拥有更加接近人类的思考过程。
这样一来,k0-math可以解决高难度的数学问题,以及历史⼤模型极难完成的⼀些边界问题。
月之暗面称,在业界最常使用的数学能力基准测试MATH中,k0-math模型得分为93.8,o1-mini和o1-preview则分别为90分和的85.5分。
先用一道2024年高考数学题考验Kimi,题目为:若曲线y=e^x+x在点(0,1)处的切线也是曲线y=ln(x+1)+a的切线,则a=?
经过8步的分析和验证,Kimi给出了正确答案:a的值为ln2。
高考数学题没有难住Kimi数学版。既然官方说Kimi数学版不只懂数学,我们也试试其他问题。先来一个龟兔赛跑悖论问题,思考过程果然有趣:问题似乎暗示了一个无限循环,即兔子永远也追不上乌龟。但实际上,这个悖论源于对时间的无限分割,导致了无限的追赶步骤。然而,在现实中,时间并不是无限可分的,而是连续的。因此,兔子和乌龟之间的距离会随着时间的推移而逐渐缩小,最终兔子会追上乌龟。
在被问到外星人是否存在时,Kimi从目前的证据、对生命的理解和概率这三个角度给出了它的分析,展示出了人类思考时的逻辑性。
而有的回答甚至具有了理性之外的思辨。
如果问个更好玩的呢?《水浒传》里哪位好汉的武力值最强?Kimi首先想到的是卢俊义,还将卢俊义与林冲、武松、关胜进行了比较,综合考虑了他们的个人武艺、战斗经验、武器技能以及在梁山上的地位,最后判断“卢俊义无疑是武力值最强的代表之一”。
但是,对于非常简单的数学问题,比如问“1+1等于几”时,它回答说:“这看似简单,但还是不可以掉以轻心,让我们一步步来”。同时,对于一些高考难题和国际数学奥林匹克竞赛(IMO)题目,模型还不能保证100%做对。现阶段,数学推理模型还存在这些局限性,仍然有待继续迭代和突破。
AI助手初现两强格局
自2022年冬天ChatGPT掀起生成式AI狂潮以来,众多企业纷纷下场,国内AI大模型赛道一度十分拥挤。如今,经过一年多时间的角逐,toC应用端的格局趋于稳定,已形成2+N的格局——综合用户规模、增长、活跃、留存等多项指标,Kimi在创业公司中脱颖而出,而豆包则是巨头公司中的领先者,且逐渐拉开了与后面玩家的差距。
从数据看上,在工作场景为主的PC端,根据 Similarweb的数据,10月份Kimi网站访问量2800多万,豆包 1600 多万。在手机APP端,根据量子位智库统计的数据,豆包和Kimi今年新增下载量均超过5000万。比其他同类产品高出一大截。
据Kimi创始人杨植麟介绍,到今年10月,Kimi在PC网页、手机App、小程序等全平台的月度活跃用户已超过3600万,而且数据仍在持续增长。
拥有着字节巨大流量和娱乐基因的豆包擅长聊天,而Kimi更像一个踏实干活儿的理性助手。
在杨植麟看来,AI的思考能力和交互水平都很重要,但是思考能力更加本质,是当下大模型需要解决的第一要务,而数学最能锻炼模型的思考能力。作为国内领先的大模型公司之一,Kimi已率先掌握了基于强化学习、合成数据和思维链的新技术,k0-math模型的一大价值正在于实现技术上的迭代和验证。
目前,k0-math数学模型和升级后的Kimi探索版已陆续上线网页版,后续也将上线手机客户端。
http://mp.weixin.qq.com/s?__biz=MjM5MTM3NTMwNA==&mid=2661532754&idx=1&sn=0b60ccbeee24fe506440428720bc42f3
第一财经
第一财经官方公众号,致力为广大投资者打造权威的财经信息平台,同时,努力成为第一财经忠实用户的交流平台。
最新文章
“996奋斗无忧险”熬夜猝死最高获赔60万?平安财险回应;中国恒大,新消息!94岁巴菲特公布后事安排|大公司动态
发布会后,有人直接给他微信转账6万!
涨声再起,交易活跃!地产中介迎来一年最繁忙时间
今日化债发行规模再破千亿!11月发行规模将破万亿
鸿蒙步入关键期!华为徐直军:共创产业星辰大海
主播、高管、金主…一文看懂特朗普2.0内阁
晚间公告丨11月26日这些公告有看头
逼真到吓人!花几十万“复制”自己,你管这叫机器人?
秦朔:拼多多和字节跳动需要高度重视来自社会的批评
什么是“模因股”?只适合短期投资吗?
威海市商业银行荣获“2024年度ESG金融服务创新卓越机构”等四个奖项
超3700只个股下跌
炸裂暴涨!超2200%!
一文概览:大模型在医药健康领域进度几何?
港交所陈翊庭:正在筹备互联互通优化措施,外资投内地市场有较大提升空间
特朗普妄言对进口自中国的商品加征10%的关税
赚钱效应偏好!
加拿大突发!各省省长要求与总理紧急会面!
错了7处!深夜通报:停职、问责!
“天价抗癌药”,纳入医保难!
直面算法背后真相,改良网络文明土壤
刚刚!京东声明
特朗普再挥“关税大棒”!
“以黎停火协议达成”!黄金暴跌!重磅会议!央行等九部门最新发声;“以丝代绒”电商园区被查
深入圈层精耕细作 长安福特聚焦价值营销 开辟用户运营新赛道
监管层出手!多家“不按需投递”快递公司被处罚
美团回应恶意退款导致“骑手商家被封号”|大公司动态
王宝强被举报诈骗?警方通报!
广电总局出手整治“霸总”微短剧!
2024数据资产管理峰会在沪举办,加快释放数据资产价值
国产AI,两强初现
羽绒价格上涨近一年!低价羽绒服以次充好,今冬还穿得起真羽绒吗?
快来加入我们!生产队招“驴”(实习版)
产业大裁员:约5万员工面临失业!
第十三届中国食品健康七星奖——破局寒冬,以“质”为镐,共筑食品行业可持续未来
晚间公告丨11月25日这些公告有看头
震动金融圈!被传失联后又突然恢复履职,发生了什么?
库克再访华:没有中国就没有现在的苹果!
网易云音乐,再发声!
尾盘“V”了!
香帅带你看懂商业的“信任法则”| 来点财经范儿
巨头突然宣布:降价!
突发!网易云音乐怒怼QQ音乐:满屏写着“抄袭”!
刚刚!南通通报!
刚刚!央行最新操作→
躬身践行ESG,九方智投控股致力推动长期可持续发展
阿斯利康此前被逮捕的销售人员将犯罪事实指向公司或上级!“骗保案”更多细节曝光→
特朗普,大动作!事关俄乌冲突!
黄仁勋,现身大排档!
俄乌最新!已击毁!多人死亡;胖东来发声明!警告这一行为;再创新高!美国国债突破36万亿美元
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉