最近爆火的DeepSeek-R1固然亮眼，但Kimi K1.5的含金量也不容忽视！

文摘 2025-02-07 21:26 湖北

！关注不迷路

标题：最近爆火的DeepSeek-R1固然亮眼，但Kimi K1.5的含金量也不容忽视！

还记得我们小时候做数学题，有时候需要一步一步写下详细的解题过程，有时候则可以“跳步”，直接得出答案。对于AI来说，也一样。有的AI擅长“长篇大论”，把每一步都想得清清楚楚（这叫“长思考”，Long-CoT），有的AI则更喜欢“短平快”，直接给出结果（这叫“短思考”，Short-CoT）。

最近，一家名为月之暗面的公司，推出了一款叫做 Kimi K1.5 的AI模型，它不仅能“想得长”，还能“想得巧”，把这两种能力结合得非常好，在很多测试中都取得了优异的成绩。

Kimi K1.5 的“独门秘籍”：

1. “长长的思考” (Long Context) + “部分展开” (Partial Rollouts)：

• Kimi K1.5 能记住很长的“思考过程”（长达12.8万个“字”或“词”），这让它在解决复杂问题时更有优势。
• 为了提高效率，它还采用了“部分展开”的方法，把长的“思考过程”分成一段一段处理，就像我们写长文章一样，可以分段写作、分段保存。

2. 简洁高效的强化学习 (Simplified RL Framework)：

• 不再像传统方法一样，构建各种复杂的辅助模块。
• 专注于最终结果的奖励，避免过程中的干扰。
• 通过强化学习，让AI自己“摸索”出解决问题的好办法。

3. “看图说话” (Multimodal Training)：

• Kimi K1.5 不仅能处理文字，还能处理图片，甚至视频，实现真正的“多模态”理解。

4. “从大到小”的智慧 (Long2Short)： 这也是Kimi K1.5最特别的地方之一。它不仅自己能“想得长”，还能把这种能力教给“小巧”的模型，让它们也能“想得巧”。它用了以下几种方法：

• 模型合并： 把“大个子”和“小个子”的能力结合起来。
• 挑最短的： 让AI想出很多种解决办法，然后挑最短、最正确的那个来学习。
• 直接偏好优化（DPO）： 训练“小个子”模型学会“短平快”。
• Long2Short RL： 用强化学习来专门训练“小个子”模型。

Kimi K1.5 和最近爆火的DeepSeek-R1：各有所长

你可能听说过另一款AI模型，叫做最近爆火的DeepSeek-R1。它也很厉害，尤其擅长数学、编程和逻辑推理。那么，Kimi K1.5 和最近爆火的DeepSeek-R1 有什么不同呢？

特性	Kimi K1.5	最近爆火的DeepSeek-R1
训练方法	结合了强化学习（RL）和长上下文扩展（long-CoT），支持多模态数据（文本和图像）	主要通过纯强化学习（RL）进行训练，不依赖于监督微调（SFT）。
推理能力	在长上下文模式（long-CoT）下，能处理长达12.8万个token的文本，擅长复杂推理和多模态任务；在短上下文模式（short-CoT）下，推理速度更快。	擅长数学、编程和复杂逻辑推理，思维链长度可达数万字。
应用场景	支持多模态任务，适用于更广泛的领域，如教育、创意设计、个性化学习等。	主要面向数学、编程和复杂逻辑推理任务，适合需要深度理解和高质量内容生成的场景。
技术特点	引入了“Long2Short”策略和“Partial Rollouts”技术，平衡了长上下文推理的效率和准确性；支持多模态数据联合训练。	强调纯强化学习训练，避免了传统监督微调的依赖，降低了训练成本。
训练/推理成本	训练和推理成本较高, 未有明确的数字	成本相对较低，为同类模型的十分之一；推理成本也大幅下降。

简单来说：

• 最近爆火的DeepSeek-R1 就像一个“数学天才”，特别擅长解决数学、编程难题，而且训练成本更低。
• Kimi K1.5 则更像一个“全能选手”，不仅能解决复杂问题，还能处理图片、视频，而且它还很会“教学生”，能把自己的能力传授给“小巧”的模型，让它们也能高效地解决问题。

总结：

Kimi K1.5 和最近爆火的DeepSeek-R1 都代表了AI领域的重要进展，它们各有优势，也各有不同的应用场景。Kimi K1.5 的“Long2Short”策略，让我们看到了AI模型在“举一反三”、“触类旁通”方面的巨大潜力。未来，AI或许真的能像人类一样，既能“深思熟虑”，也能“灵活应变”，为我们解决更多更复杂的问题。

如果您觉得这篇文章还不错，欢迎点赞、关注、转发。

如果您想要让大模型写出优质的短篇小说，以及对其他内容感兴趣，也欢迎点击下面的链接，效果不错哦，很多朋友都说好。

点击这里：超强写作提示词以及最强写作指导

效果如下

世界潮流浩浩荡荡顺之则昌逆之则亡。AI来了!AIGC，LLM，大模型，规模效应，软件开发

最新文章

各AI大厂官方指令库大公开！照着抄秒变AI大神！

GitHub 资深工程师如何巧用大语言模型 (LLM) 提升工作效率

最近爆火的DeepSeek-R1固然亮眼，但Kimi K1.5的含金量也不容忽视！

从 ChatGPT 到 AI 智能体：深入浅出大语言模型 (LLM) 全解析 (Andrej Karpathy 新作解读！)

数据“食量”大比拼：人类大脑 VS 大模型，谁的学习效率更高？

听说AI很厉害？它还能帮孩子学习？带你了解AI辅助学习的那些事儿

挑战 OpenAI Deep Research！开源替代方案来袭！

关于AI，近期的一些想法

七天解锁AI神技，DeepSeek 让你效率飞升，生活开挂！

AI也来算命？DeepSeek教你用“三钱法”给自己“算一卦”！超简单

免费AI研究神器：GPT Researcher硬刚OpenAI Deep Research

Lex Fridman Podcast #459 干货精编：DeepSeek、中美AI竞赛与未来趋势

你还在怀疑DeepSeek是靠炒作才起来的吗，看看这组数据

预见2025创业黄金时代：YC重磅发布AI创业十大风口领域！下一个独角兽可能就在这里！

DeepSeek的含金量还在提升，OpenAI CEO承认开源策略失误，竞争加剧或促成重大变革

吴恩达：DeepSeek “觉醒”！中国 AI 如何颠覆全球格局

别让 AI 沦为“背书匠”：Karpathy 揭示大语言模型的真正学习之道

DeepSeek 杀出来了！AI 圈大地震：低成本模型、开源挑战，美国这次真要反思了

DeepSeek？不存在的威胁！ (只要我们掐死他们的芯片)

拼多多又来作妖了，看看DeepSeek-R1如何吐槽，文末有提示词

AI 大神 Karpathy 再次发声：深度学习的魔力源自“试错”，算力是终极上限！

DeepSeek：在技术封锁的荆棘中开辟开源AI的新大陆

DeepSeek-R1的写作能力，用评书讲大语言模型

DeepSeek-R1的写作能力，再看这个仿写，还是很强

DeepSeek-R1的写作能力真的是很强啊

【草履虫都看得懂的教程】零成本在本地运行DeepSeek R1大模型！隐私安全+永久免费+中文优化

AI大神Andrej Karpathy：OpenAI Operator预示着AI智能体的未来，但仍需突破！

DeepSeek的“顿悟”时刻：一场没有教科书的AI推理进化

AI时代弄潮儿：成为一名合格的LLM工程师，你需要掌握这些技能！

prompt 逆天了！OpenAI直接用流程图指挥 AI，这也太酷了吧!

话糙理不糙，你猜猜实现这样有个性的AI机器人有多简单?

AI编码工具Codeium 憋了个大招：Windsurf Wave 2！

Devin.AI：天价AI程序员，值回票价了吗？

一种新的思路，探索式写作：让你的故事自然生长

吴恩达：这样做能够更好地跟上AI的时代浪潮

AI指令的秘密：三个关键词就能让AI效果翻倍

三行代码构建AI Agent，释放LLM潜能！Hugging Face Smolagents让AI自己动手！

本地部署AI模型，免费又安全地让你的工作生活效率起飞！

AI辅助写作-短篇武侠小说

惊艳！Google出品的Gemini仿写诗歌，AI的理解力与创造力超乎想象

Sam Altman 回顾 ChatGPT 爆火之路，坦诚被解雇内幕，展望 AGI 未来 —— 读《反思》有感

斯坦福的STORM项目之后，我们还能这样让AI成为最强写作指导

Agents is all you need！谷歌发布 AI Agent 白皮书

19k! 斯坦福大学出品的这个项目, 让AI写出高质量文章, 7万人已使用

灵魂的低语：AI与文字的交响

2024，我追过的 AI 风口

让你的小说脱颖而出！AI一键打造完美故事蓝图

一键生成小说开局，快速吸引注意力，让创作更轻松

一键生成小说人物设定，让创作更轻松

206分钟，雷军首次袒露造车心声：我不想输，更不愿辜负大家！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉