Kimi大动作，AI助手大爆发！

财富 2024-11-19 06:29 上海

近期，AI助手（AI Agent）备受热捧。

前有国内智谱AI智能体AutoGLM持续刷屏，最新消息OpenAI首个AI助手（Agent）产品或将于明年1月发布。

此外，微软、苹果、华为、小米等国内外头部厂商也正争先推出AI助手相关产品。

A股市场上，近期AI助手&应用相关热度持续高企，中科金财、豆神教育等持续大涨。

OpenAI“下一个重大突破”

或将是AI助手

据科创板日报报道，OpenAI正准备推出一款代号为“Operator”的全新AI助手产品，可以自动执行各种复杂操作，包括编写代码、预订旅行、自动电商购物等。

根据内部员工爆料，OpenAI领导层预计将在2025年1月发布该产品，首先作为研究预览版和开发工具推出，届时将为开发人员开放API接口。

资料显示，AI助手（AI Agent），是一种模拟人类智能行为的人工智能系统，以大型语言模型（LLM）作为其核心引擎，基于复杂多模态数据的处理能力，它们能够感知环境，做出决策，并执行任务以实现特定的目标。对于普通用户而言，AI助手最核心的功能是AI自主操作手机，辅助完成复杂推理任务。

OpenAI的CEO山姆奥特曼几周前在Reddit的“问我任何问题”（Ask Me Anything）论坛上表示：“我们将拥有越来越好的模型，但下一个重大突破将是AI助手。”

AI助手将进入大爆发期！

事实上，目前国内外头部厂商正争先推出AI助手产品。

10月25日，智谱AI推出自主智能体AutoGLM，只需接收文字/语音指令，就可以模拟人类操作手机，开启人机交互全新模式和应用新蓝海。具体来说，当你向AutoGLM发出指令后，它能够代替你在手机和网页上完成各种操作，比如写点评、电商下单、写摘要、点外卖、发微信等。

10月23日，Anthropic推出全新Claude 3.5 Haiku和升级版Sonnet。Sonnet能力不仅全面超过GPT-4o，更带来全新AI体验：计算机使用，可以像人类一样操作电脑。

与过去AI Agent直接通过代码/程序，后台联网搜索/操作应用不同的是，这一次Claude真正像人类一样去使用电脑：先看屏幕，再使用鼠标操作，再通过思考，重复以上步骤直到完成目的。在这个过程中，Claude每一次截图查看屏幕，移动光标/点选，并给出思考的全过程。

此外，据不完全梳理统计，

10月22日，微软宣布在Dynamics 365中集成10个自主AI Agent，支持OpenAI最新模型o1，具备自主学习能力，可自动执行跨平台复杂业务。微软近期还低调开源了AI工具OmniParser，其可帮助用户创建个性化智能体，以操作个人计算机。

谷歌计划在12月预览其大型动作模型“Project Jarvis”，该项目将帮助用户执行诸如“收集研究、购买产品或预订航班”等任务。

苹果选择将Siri与ChatGPT集成，实现更智能的人机交互。

华为则公布了一项可让AI像人类一样操作手机的新研究成果，相关团队提出一个手机控制架构：Lightweight Multi-modal App Control（轻量级多模态应用控制，简称LiMAC）。

德邦证券认为，2025年或进入全终端Agent爆发元年，Agent network有望初具规模，终端有望率先放量、其次是全行业落地应用，AI应用商业模式闭环或将形成。

此外，上个月OpenAI首席产品官Kevin Weil也曾表示：2025年将是Agent系统最终进入主流的一年！

Kimi重磅大动作

新模型媲美OpenAI最强模型

11月16日，正值国产大模型独角兽月之暗面Kimi Chat向全社会开放服务一周年之际，月之暗面正式发布其新一代数学推理模型k0-math，意在与OpenAI的o1系列相抗衡。

众所周知，此前9月12日，OpenAI发布了最新的大模型OpenAI-o1，新模型包括o1-preview和o1-mini两种版本。

按照OpenAI的说法，这是他们迄今为止最强、最一致的模型，对于复杂推理任务而言，新模型代表着人工智能能力的崭新水平，因此值得将计数重置为1，给它一个有别于“GPT-4”系列的全新名号。

与之前的版本相比，新模型最重要的一点就是使用了全新的“思维链模式”(Chain-of-Thought,CoT)，一种“高阶推理的新范式”，擅长复杂任务推理，能在科学、编程和数学等领域解决比以往模型更难的问题。

怎么理解这个“思维链模式”？

打个比方，有点儿类似于丹尼尔·卡尼曼在书《思考，快与慢》中提出的人类大脑的两个思考系统，即依赖直觉和经验、快速且无意识的系统1和深思熟虑、谨慎且有意识的系统2。

o1模型的发布，意味着大模型从运用系统1发展到了运用系统2，表现在使用过程中，即为大模型不再是对问题做出即刻响应，而是先进行一定时间的思考，生成解释推理过程的内部思维链。

而月之暗面最新发布的k0-math能力如何呢？

据基准测试显示，目前在中考、高考、考研以及包含入门竞赛题的MATH等4个数学基准测试中，k0-math初代模型成绩超过了OpenAI o1系列的o1-mini和o1-preview模型；在两个难度更大的竞赛级别的数学题库OMNI-MATH和AIME基准测试中，k0-math初代模型的表现分别达到了o1-mini最高成绩的90%和83%。

月之暗面创始人杨植麟在接受采访时表示，“如果说长文本是月之暗面登月的第一步，那么提升模型深度推理能力则是第二步。

其指出，大模型需要提升思考能力。

“AI最重要的是思考和交互这两个能力，思考的重要性远大于交互，不是说交互不重要，交互是一个必要条件，但思考会决定上限。因此，接下来很重要的一件事是让AI具备思考的能力。”

而最适合让AI锻炼思考的能力，无疑是数学场景，伽利略曾说过，宇宙是由数学这门语言书写而成的，它是整个宇宙的基石，很多规律只是通过数学来刻划的。而且好处是并不需要跟外界进行交互，相对来说比较严密的自成一体，它自己可以成为一个体系，这让数学成为AI学习这种思考能力的一种非常好的场景。”

Scaling laws依然有效

强化学习是重点

自ChatGPT发布后，通过增加更多数据和计算能力来“扩大”当前模型，便能持续改进模型的能力，即所谓的Scalinglaw（尺度定律）几乎成为业内共识。

但OpenAI原首席科学家Ilya Sutskever日前公开表示，扩大预训练的结果已经达到了平台期，每个人都在寻找下一个东西。

Scaling laws是否依然有效？

月之暗面创始人杨植麟认为，Scaling laws依然有效，但需更好的方法。预训练大模型还有迭代空间，预计还有半代到一代的模型的空间会在明年释放出来，明年业内领先的模型会把预训练做到一个比较极致的阶段，接下来最重点的东西会在“强化学习”上，但它还是Scale，只是用不同的方式去Scale。”

其同时提到，AI的发展就像在荡秋千，在两种状态之间来回切换：

一种是算法、数据准备好了，但算力不够，从Transformer架构诞生到GPT4的出现，更多的矛盾在于如何扩大规模（Scale），在算法和数据上不存在本质问题。

但到了今天，规模已经到达了一定的程度，会发现再加更多的算力，也不一定能解决问题，其中核心问题是没有高质量的数据，这时要做的事便是改变算法，突破瓶颈。现在这是他所在的公司乃至整个行业都面临的共同问题，好的算法能够释放Scaling的潜力，让模型持续变得更好，强化学习是接下来很重要的一个趋势。

杨植麟同时提到，目前kimi每月使用人数已达到3600万，而且数据在持续增长，当下月之暗面最核心的任务就是提升用户留存率。

关于AI助手，Kimi,AI大模型，大家还有啥想法？怎么看？欢迎评论区讨论交流呀~

免责声明（上下滑动查看全部）

任何在本文出现的信息（包括但不限于个股、评论、预测、图表、指标、理论、任何形式的表述等）均只作为参考，投资人须对任何自主决定的投资行为负责。另，本文中的任何观点、分析及预测不构成对阅读者任何形式的投资建议，亦不对因使用本文内容所引发的直接或间接损失负任何责任。投资有风险，过往业绩不预示未来表现。财经早餐力求文章所载内容及观点客观公正，但不保证其准确性、完整性、及时性等。本文仅代表作者本人观点。

http://mp.weixin.qq.com/s?__biz=MzA5MTE4MzI5Mw==&mid=2651090050&idx=2&sn=57b032a264f1e8e5181345cf0cbae84c

财经早餐研究中心

专注于探索世界的真相，致力于洞悉未来的趋势。

最新文章

【财经早餐】2024.11.23星期六

谷歌“摇钱树”，面临“抄家式”打击？

Femorning Daily 23.11.2024

【财经早餐粤语版】2024.11.23星期六

【财经早餐】2024.11.22星期五

高通的“第二曲线”，在哪里？

三季度大赚超百亿，“猪王”牧原股份，会笑到最后吗？

Femorning Daily 22.11.2024

【财经早餐粤语版】2024.11.22星期五

【财经早餐】2024.11.21星期四

科大讯飞单季度利润终于转正，AI商业化拐点来了？

农夫山泉钟睒睒：永远不会直播带货，也看不起直播带货的企业家！

Femorning Daily 21.11.2024

【财经早餐粤语版】2024.11.21星期四

【财经早餐】2024.11.20星期三

超200万预约，“史上最强Mate”即将报到？

Femorning Daily 20.11.2024

【财经早餐粤语版】2024.11.20星期三

【财经早餐】2024.11.19星期二

Kimi大动作，AI助手大爆发！

银邦股份闪崩跌停，发生了什么？

Femorning Daily 19.11.2024

【财经早餐粤语版】2024.11.19星期二

【财经早餐】2024.11.18星期一

原油跌跌不休！40美元才是归宿？

利率倒挂，成为生活常态？

Femorning Daily 18.11.2024

【财经早餐粤语版】2024.11.18星期一

【财经早餐】2024.11.17星期日

纸巾，一门帮人“体面”的好生意

Femorning Daily 17.11.2024

【财经早餐粤语版】2024.11.17星期日

【财经早餐】2024.11.16星期六

港股治不好顺丰的现金焦虑

Femorning Daily 16.11.2024

【财经早餐】2024.11.15星期五

全球第一，产量破千万，新能源车行业加速洗牌！

Femorning Daily 15.11.2024

【财经早餐粤语版】2024.11.15星期五

【财经早餐】2024.11.14星期四

比英伟达更猛，华尔街AI新宠出现了！

万亿冰雪产业，风云再起！

房地产重磅利好，终于来了！

Femorning Daily 14.11.2024

【财经早餐粤语版】2024.11.14星期四

【财经早餐】2024.11.13星期三

黄金跌了，好开心？

GDP接近巅峰！江苏，为什么行？

市值“脚踝斩”后，中国中免能翻身吗？

Femorning Daily 13.11.2024

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉