首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
Kimi、豆包领跑,国产AI迎来新格局
财富
2024-11-25 21:01
四川
一道步骤难懂的数学奥赛试题、一场组会中的“头脑风暴”、一个需要做大量“功课”才能做出的生活决策——当大模型能像人类一样思考时,你会发现,这一切都将在一次回车的敲下后迎刃而解。
“什么样的场景最适合让AI锻炼思考能力?我们认为是数学场景。”
11月16日,月之暗面创始人杨植麟发布了新一代数学能力可对标OpenAI o1系列的数学推理模型k0-math
,
在中考、高考、考研以及包含竞赛题的MATH等数学基准测试中,k0-math初代模型成绩已经超过o1-mini和o1-preview模型。
“这可以说是,在OpenAI o1发布后,国内首个摸索出并实现o1思路的公司。”对于k0-math的推出,一位国内头部互联网公司的大模型技术人员表示,k0-math模型采用的全新强化学习和思维链(CoT)推理技术,正是业内普遍认为OpenAI o1系列的技术关键所在,国内多家互联网巨头均在破解这一“新思路”,但在k0-math发布时,尚未有其他类似模型问世。
在“百模大战”开战的一年多里,新技术、新团队、新应用不断涌现,战况也随之频繁变动。从月之暗面、零一万物等“新AI六小龙”和字节跳动、阿里等互联网大厂团队在混战中脱颖而出,到如今应用最广的AI智能助手陆续上线,
可以观察到的是,豆包和Kimi的领先让AI智能助手领域逐渐呈现出了“两超多强”的新格局。
新模型登场
Kimi对标o1
“如果你有100枚硬币,每枚硬币正面朝上。每次翻转包含当前正面朝上的硬币和它相邻的两枚硬币。最少需要翻转多少次才能使所有硬币反面朝上?”
仿佛一个数学天才型选手,Kimi数学版在40秒钟里完成了对该题的问题分解、3种思路尝试、解法验证并正确作答的全套解题流程。
值得注意的是,其中,“意识到逐个翻转硬币不可行,我开始思考如何最大化每次翻转的效果”“意识到翻转之间隔两枚硬币会导致重叠,我考虑增加间隔”等对思维链推理的展示,均是模型自我思考能力的体现。
今年9月,被Open AI创始人Sam Altman喻为“新范式开始”的o1诞生,以模仿人类思维过程进行的强化学习和思维链技术,突破了AI推理瓶颈。自此,行业的技术焦点也从预训练转向了推理和强化学习。
11月16日,Kimi率先交出国内首份答卷。据介绍,相较于以尽快提供答案为关键目标的常规模型,新推出的k0-math模型在做题过程中会花更长的时间来推理,包括思考和规划思路,并且在必要时自行反思改进解题思路,提升答题的成功率。
发布会上,月之暗面公布了k0-math的目前测评得分:
在业界最常使用的数学能力基准测试MATH中,k0-math模型得分93.8分,超过o1-mini的90分和o1-preview的85.5分,且k0-math这一成绩仅次于o1完全版的94.8分。
在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中,k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。
从线上AI社区的讨论中选取一道数学题进行实测,Kimi数学版用时2分10秒完成了对该题的正确解答。
从线上该帖的评论区反馈来看,在求解该题时,o1-mini和o1-preview在用时上有约30秒的优势,但多次测试均未得出正确答案。
左右滑动查看更多
“该数学推理模型上的技术也可以被放进更多的场景里,例如让Kimi探索版去做更多的探索。”
正如杨植麟在发布会上所言,全新技术范式带来的推理能力提升,也能泛化到更多日常任务上。
编辑就“找到北上广深的各个市辖区内,有重点初中,还有直升高中并且每年至少20个清北,告诉我这个区最适合的学区房”这一较为复杂的指令,对Kimi探索版、Kimi普通版和另两款知名AI产品进行测试。
测试结果显示,Kimi探索版在搜索量、搜索内容和生成内容上优势明显,甚至出现了对1311个网页的分析,直观感受到Kimi探索版在意图增强、信源分析和链式思考上的能力提升。
豆包、Kimi的领先
分水岭明显
Kimi领先的每一步,都在一次次搜索中被用户清晰地感知着。
“以前2、3个小时才能看懂的文章,用Kimi几分钟就能得到所有关键信息,现在也会在实验中让探索版给出研究设计、方法论选择上的建议。”一位江南大学的在读工科博士表示。
基于Kimi对学术研究、市场分析等专业应用场景的不断深耕和所体现出的明显优势,其用户群体涵盖了学生、科研人员、职场人士和内容创作者等知识需求型人群。月之暗面也表示,Kimi探索版发布后,受到了程序员、科学家、咨询顾问、投资人、律师等专业人群的喜爱。
从用户体量来看,根据量子位智库统计的数据,
截至今年10月,在国内现有的68款AI智能助手产品中,只有豆包和Kimi迈过“5000万大关”,其中豆包历史累计下载量破亿,Kimi智能助手下载总量超过5700万。
榜单中,排名第3、4位的产品下载总量各超过2000万。同时,10月新增用户超1400万的Kimi还在将身后的差距逐渐拉大,有望成为“破亿俱乐部”的下一位成员。
第三方平台点点数据也显示,
今年10月,ChatGPT、豆包和Kimi智能助手位列全球AI APP苹果端下载量前三,占据了全球苹果端AI APP下载量的51%。
在用户黏性方面,量子位智库指出,我国AI智能助手产品今年10月的留存率基本与上月持平,豆包和Kimi仍稳居前二,两者平均三日留存率超27%,平均七日新增留存率约18%。而其他AI助手产品的平均三日留存率均在25%以下。
此外,从用户活跃度来看,Kimi的10月日活用户量也仅次于豆包。
月之暗面公布的数据显示,截至今年10月,Kimi的月活已超3600万人,而且数据仍在持续增长。
从用户体量、活跃度和黏性等多个重要维度来观察,豆包和Kimi已处于第一领跑集团,并与随后各梯队间出现鲜明的分水岭。
“竞争本身并不产生价值,我们做好模型思考推理能力,给用户带来价值,做正确的事情,而不是专门做不一样的事情。”在k0-math的发布会上,杨植麟谈及和以交互能力见长的豆包的竞争时,再度以“聚焦”作为回应。
学会“聚焦”,这是杨植麟过去一年中的一个大课题。
如今,这个“创业明星”和他的团队决定眼看前方,继续以加速度向月之暗面迈步前去。
记者|
杨昕怡
编辑
|
蒙锦涛
http://mp.weixin.qq.com/s?__biz=Mzg3NTA5MjkyNQ==&mid=2248385905&idx=1&sn=5c380319ed7d00b6387bdd7742cc6607
每日经济新闻
中国主流财经全媒体。互联网新闻信息服务许可证编号:51120190017 。
最新文章
以色列,大消息!拜登发声!
美联储12月或降息25基点;9.24亿元!一地转出“低空经济30年特许经营权”;金与正:韩国再次向朝鲜散发反朝宣传单
爆雷!买房“免息垫首付”出事了:10余个楼盘卷入,个别涉千万元……几十套房源已被当地住建部门锁定!
突发!关键时刻,以军发动“最猛烈袭击”
俄媒公布恐怖“时间图”:发射“榛树”导弹,到柏林15分钟,伦敦、巴黎20分钟!俄欧再度陷入“中导危机”?
9.24亿元!县发改局招标,县财政局独资国企中标!一地“低空经济30年特许经营权”成功转出
“大理石瓷砖”可以用了!但广告语“高档装修,不用大理石,就用简一”仍是虚假宣传
突然宣布!重要服务停止,“回馈计划”同步公布
4000元本金,1天可赚9万元!一家化肥公司,何以创造暴涨22倍奇迹?
不止于颜值,智界新S7如何俘获年轻人的心?
财富、资管、投行全面开花,山西证券荣获2024金鼎奖四大奖项
个人财富已减少56%,还剩1万亿元!94岁巴菲特突然宣布后事安排:只留0.5%股份给三个孩子
打赏女主播,花费超50万元!落马副局长出镜:像个瘾君子,在网络中寻求自我安慰
“雷军是我大哥”!何小鹏:当年买了1亿多美元小米股票,“终于赚钱了,很开心”
中国银行原董事长刘连舸,被判死缓,并处没收个人全部财产!他受贿1.21亿余元,违规放贷33.2亿余元
墨西哥总统:所谓中国产品“借道”入美的说法不正确!中国外交部最新回应
富商去世,将遗产留给第三者和私生女,法院:非婚生女继承80%遗产,婚生女继承20%,婚外情对象不能继承!
起诉!男子见义勇为受伤,被救老人拒绝进行情况确认!法院判决老人赔偿7000元
14:43,跳水!绿了
特朗普妄言将对进口自中国商品加征10%关税,我驻美使馆最新回应!他还称将对进口自墨西哥和加拿大的所有产品征收25%关税
国务院最新任命!他担任这家公司董事长,公司执掌中国1.33万亿美元主权财富基金
搞权色、钱色交易,结交政治骗子……王一新被提起公诉!曾先后担任山西、黑龙江两省副省长
造谣抹黑京东和创始人及其家人,他们被公安处罚!
“红头文件200余字现7处错字”,一地通报:工作人员已停职
突然拉升,沪指翻红!
开盘!三大指数集体低开!被指占用子公司近2.5亿元拒不偿还,一上市公司被潍坊国资诉至法院
俄军攻入库拉霍沃市中心!泽连斯基:乌军在该方向“形势艰难”!俄外交部副部长:若美国这么做,俄将考虑在亚洲部署中短程导弹!
以文化铸就卓越——中天国富证券荣膺“2024证券行业金鼎奖”两项大奖
以产品力铸就央企担当 于山水雅境启幕理想生活
比特币跌破9.4万美元;事关5G规模化应用,十二部门发文;广电总局出手整治“霸总”微短剧;董宇辉职务变动
美媒:预计以色列将于26日批准与真主党停火协议!黄金、白银大跳水,国际油价大跌!巴菲特有新动作
同花顺,突发!整治“直播炒股”,浙江证监局出手!
“国家队”大扩容,哪些地方胜出了?
刚刚 ,美媒称以色列和黎真主党达成停火协议
重磅!央行等九部门:“应签尽签、能投尽投”
Kimi、豆包领跑,国产AI迎来新格局
前世界冠军吴柳芳账号大量视频被删!已被禁止关注,背后签约机构曝光!管晨辰最新回应了
百万年薪女董秘,被前员工实名举报!在公司任职已达17年,公司最新回应
“人都傻了”!每年7000元连交10年保险,重病住院却被告知无法理赔,涉及知名保险巨头!业务员解释原因,并称正在申请退保费
国牌高峰论坛:解码标杆国牌增长方法论
突发!乌军用外国导弹对俄罗斯发动大规模攻击!特朗普团队给出解决俄乌冲突时间!俄方:拜登在给特朗普“挖坑”
靠烟吃烟,对家属失管失教!国家烟草专卖局原局长凌成兴,被提起公诉
A股反弹了!3700多股上涨,这个概念爆火!市场交易热度回落因散户情绪降温?机构解读
销量承压,特斯拉官宣新优惠!Model Y 限时交付尾款立减1万元,公司股价近期已大涨40%
黄仁勋现身大排档,与陈茂波、沈南鹏等人同桌!他近期密集访问亚洲,和孙正义对话,在印度同亚洲首富交谈
“金融为民”系列之6——做普惠金融综合服务商,邮储银行打造服务乡村振兴主力军
潮州消防检查引发关店潮?警方通报:5人散播谣言被处罚
震荡,三大指数转绿!“6000亿元金矿”发酵,湖南黄金三连板!华尔街巨头:看好A股
开盘!三大指数齐涨!超2600只个股上涨
16万股民迎利好?昔日千亿房企重整破局,“救命钱”预计达30亿元!背后现冯仑等资本大佬身影
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉