追平满血版o1的国产多模态模型终于来了!训练细节全部公开

科技   2025-01-21 10:30   江苏  

点击蓝字


关注我们

关注并星标

从此不迷路

计算机视觉研究院


公众号ID计算机视觉研究院

学习群扫码在主页获取加入方式


计算机视觉研究院专栏

Column of Computer Vision Institute

春节前最后一周,能媲美 Open AI 满血版 o1(Full Version,而非 preview)的模型终于出现了!

方案优势特点


  • 技术报告:Kimi k1.5:借助大语言模型实现强化学习的 Scaling
  • 报告链接:https://github.com/MoonshotAI/kimi-k1.5



在 short-CoT 模式下,Kimi k1.5 在数学、代码、视觉多模态和通用能力上,也达到了全球范围内短思考 SOTA 模型 ,并大幅领先 GPT-4o 和 Claude 3.5 Sonnet 的水平。比如,Kimi k1.5 在 AIME 上达到 60.8 分,MATH500 上达到 94.6 分,LiveCodeBench 上达到 47.3 分。


不仅如此,从全球前沿大模型数学竞赛和编程竞赛基准测试来看,Kimi k1.5 的表现也相当不错,处于全球第一梯队,而这两项测试代表了人类智商巅峰。








我们也期待新模型的早日上线!

参考链接:[1] https://mp.weixin.qq.com/s/FXGdJA8OyZvLl89rXJiyAQ

计算机视觉研究院
计算机视觉研究院主要涉及AI研究和落地实践,主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架,提供论文一键下载,并分享实战项目。研究院主要着重”技术研究“和“实践落地”!
 最新文章