一线｜月之暗面发布推理模型，即将上线数学模型k0-math

科技 2024-11-17 11:41 北京

腾讯新闻《一线》刘雨点

11月16日，大模型公司月之暗面（Moonshot AI）发布新产品，一款以深度推理为核心功能的数学模型K0-math。该产品将于近日上线。

月之暗面Kimi创始人兼CEO杨植麟在现场介绍称，大模型发生了范式变化，过去是通过next token prediction，但预测下一个词有局限性，是一个静态的数据集，没办法探索更难的任务。接下来大模型的目标是通过reinforcement learning（强化学习）让AI具备思考的能力。“接下来还能持续scale，只是过程不一样。”他称。

杨植麟谈到，什么样的场景最适合让AI锻炼思考能力？他认为是数学场景，这也是前两个月OpenAI发布o1核心想要表达的要点。这样，模型可以自己成为一个体系，不需要和外界交互。同时，强化学习训练出来的模型对于每一步思考更细致，出现跳步比较少，可确保泛化能力。

怎么把强化学习更广泛的使用？把强化学习技术用在搜索场景里面。

他称，上线1年，截至目前，每月超过3600万人在使用Kimi。

据悉，除了深度推理，月之暗面也探索多模态，深度推理是提高思考能力，思考决定AI的上限；多模态提高交互能力，是必要条件。“思考的重要性远大于交互。”

另外，杨植麟在回复腾讯新闻《一线》的提问中称，去年说长文本是AGI登月的第一步，那么现在深度推理就是登月的第二步。

他认为，现在看，中美在大模型上的差距“是一个常数”。预训练scaling law遇到瓶颈，这对中国大模型团队有可能是一个好事。

对于出海，他称，现在先聚焦，再全球化，需要耐心一点。

“复盘中国大模型系列”推荐阅读

http://mp.weixin.qq.com/s?__biz=Mjc1NjM3MjY2MA==&mid=2691552517&idx=2&sn=7ba187cd9f75ef3e7acec2a65376aacc

腾讯科技

腾讯新闻旗下腾讯科技官方账号，在这里读懂科技！

最新文章

科技早报｜阿里整合国内外电商成立电商事业群；拼多多业绩未达预期股价跌超10%

日本芯片50年，中国如何“抄作业”？

科技早报｜报告称iPhone“双11”期间销量下滑；英伟达财报发布盘后一度跌超5%

微软困在Copilot里

科技早报｜SpaceX星舰第六飞未尝试“夹火箭”；余承东晒华为Mate 70真机

马斯克与OpenAI到底为何分道扬镳？早期邮件露了底

科技早报｜华为Mate 70官网预约超百万台；全球第二大显卡制造商撤出中国

造车、造火箭、办网站，马斯克是如何“降本”的

比特币突破9万美元：一场特朗普与资本共谋下的盛宴，25万散户爆仓

科技早报｜字节跳动最新估值或达3000亿美元；中国版脑机接口手术来了

从4年缩短至4个月！马斯克超算建设速度吓坏对手

一线｜月之暗面发布推理模型，即将上线数学模型k0-math

科技早报｜因违反欧盟反垄断规定Meta被罚近8亿欧元；京东Q3营收超2600亿元

清华大学教授刘嘉：大模型是一个生命新物种｜AI&Society百人百问

科技早报｜腾讯第三季度经营利润同比增19%；比特币一度突破9.3万美元

腾讯控股第三季度营收1672亿元同比增长8%，经营利润同比增19%

科技早报｜传三星停供中国大陆7纳米AI芯片；OpenAI联合创始人布罗克曼宣布回归

工资“白菜价”，但特斯拉仍能吸引10万打工人奔赴的秘密

“算力黄牛”无法一夜暴富

科技早报｜月之暗面创始人被前投资人提起仲裁；台积电被曝不能在海外生产2nm芯片

奥特曼专访自曝：OpenAI将实现AGI第三级，一人也能打造10亿独角兽

大模型连乘法都不会做？一系列新研究再次挑战AI推理能力

科技早报｜比特币突破8万美元；媒体称台积电停止向中国大陆供应先进AI芯片

科技早报｜马斯克要求台供应商产线外移；网易回应贪腐事件：案件仍在侦办

SpaceX官宣：星舰将于11月19日早6点进行第六次试飞

科技早报｜科技巨头掌门人纷纷祝贺特朗普胜选；传王慧文回归美团任AI“小队长”

Interbrand x 腾讯新闻 | 《品牌引力榜Top30》正式发布，苹果、华为巅峰相遇

科技早报｜腾讯混元再次开源；OpenAI要大搞硬件了

美国芯片“卡脖子”的钝刀与快刀

对话李开复：如果美国形成AGI霸权，我们应该怎么办？

科技早报｜外媒称字节跳动上半年营收增长逾35%；华为Mate 70系列定档11月发布

科技早报｜神舟十八号成功返回地面；阿里公布“姜萍事件”详情

科技早报｜华为前三季度利润下滑；OpenAI为ChatGPT增加搜索功能

对话知乎周源：一个内容社区CEO的孤独、宿命与和解

科技早报｜神十九航天员顺利进驻中国空间站；Meta第三季度业绩超华尔街预期

科技早报｜传OpenAI携手博通开发首款AI芯片；雷军称小米15“贵得有理由”

科技早报｜联想在海外起诉中兴通讯；苹果M4版iMac发布10999元起

2024骁龙峰会：高通不仅甩出多款王炸芯片，更剧透了未来十年的终端侧AI生态

科技早报｜谷歌将开发可控制计算机的AI；苹果AI短期不会显著提升iPhone销量

在三里屯Apple Store，我和库克聊了聊Apple Watch｜独家专访

科技早报｜首例AI机器人致死案震惊全球；雷军确认小米15将涨价

科技早报｜微信上线查看单删好友功能；特斯拉三季度净利润超预期盘后大涨近12%

黄仁勋最新演讲：英伟达正在打造“AI大脑”，将来会有1亿个人工智能助手

对话贾跃亭：拒收恒大200亿不后悔，计划两年内回国｜独家

科技早报｜华为原生鸿蒙操作系统正式发布；神舟十九号预计10月底发射

科技早报｜高通发布骁龙8 Elite芯片；内部员工称苹果AI落后竞品两年以上

万字长文：没有人能“杀死”中芯国际

独家对话诺奖评委：授予辛顿物理学奖引发对AI风险的关注，是好的副作用

科技早报｜iPhone 16系列遭遇重启Bug；SpaceX完成今年第100次轨道发射

科技早报｜知情人士称特斯拉FSD入华尚未得到批准；传诺基亚大中华区裁员2000人

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉