阿里推理模型来了！Marco-o1 发布即开源

旅行 2024-11-22 13:00 北京

阿里巴巴发布了Marco-o1！

阿里巴巴刚刚发布了一款全新的开源推理模型Marco-o1，它不仅专注于标准答案领域，更致力于解决开放性问题。

这个名为Marco-o1的模型可不是简单的大语言模型。

它通过思维链（CoT）微调、蒙特卡罗树搜索（MCTS）和反思机制等创新技术，让AI在处理复杂问题时更加得心应手。

为什么Marco-o1如此与众不同？

它不再局限于数学、物理和编程等有标准答案的领域，而是勇敢地迈向了没有标准答案的开放性问题。这就像是让AI从「做选择题」进化到了「写论文」的水平！

技术亮点全解析

Marco-o1的核心优势体现在四个方面：

思维链微调：团队使用开源CoT数据集和自研合成数据对基础模型进行全参数微调，打造出Marco-o1-CoT。

MCTS解决方案扩展：通过将大语言模型与蒙特卡罗树搜索（MCTS）相结合，利用模型输出的置信度来指导搜索，大大扩展了解决方案空间。

创新推理策略：实现了全新的推理行动策略和反思机制（Marco-o1-MCTS Mini-Step），在MCTS框架内探索不同的行动粒度，并引导模型进行自我反思。

突破性翻译应用：首次将大型推理模型（LRM）应用于机器翻译任务，探索多语言和翻译领域的推理时间扩展规律。

实力有多强？数据说话！

研究团队在Qwen2-7B-Instruct的基础上，通过精心设计的数据集进行微调。实验结果显示：

MGSM英文数据集：准确率提升6.17%
MGSM中文数据集：准确率提升5.60%

最让人惊喜的是，Marco-o1在翻译任务上展现出了惊人的实力。它能够准确理解并翻译俚语表达，将「这个鞋拥有踩屎感」这样的口语化表达优雅地转化为「This shoe has a comfortable sole」。

开箱即用！快速上手指南

想要体验Marco-o1的强大功能？只需要几行代码：

# 直接加载模型
from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("AIDC-AI/Marco-o1")
model = AutoModelForCausalLM.from_pretrained("AIDC-AI/Marco-o1")

如果你想使用vLLM加速推理，可以直接运行：

./src/talk_with_model_vllm.py

这个来自阿里巴巴国际数字商业部MarcoPolo团队的新作品，正在为AI的推理能力开辟新天地。它不仅能解决标准问题，更重要的是能够处理那些没有标准答案、难以量化的开放性问题。

这或许就是AI走向真正智能的关键一步。毕竟，人类面对的大多数问题，都不会有标准答案。

Marco-o1的开源，将为整个AI社区带来新的可能。

本文同步自知识星球《AGI Hunt》

星球实时采集和监控推特、油管、discord、电报等平台的热点AI 内容，并基于数个资讯处理的 AI agent 挑选、审核、翻译、总结到星球中。

每天约监控6000 条消息，可节省约800+ 小时的阅读成本；
每天挖掘出10+ 热门的/新的 github 开源 AI 项目；
每天转译、点评 10+ 热门 arxiv AI 前沿论文。

星球非免费。定价99元/年，0.27元/天。(每+100人，+20元。元老福利~）

一是运行有成本，我希望它能自我闭环，这样才能长期稳定运转；
二是对人的挑选，鱼龙混杂不是我想要的，希望找到关注和热爱 AI 的人。

欢迎你的加入！

http://mp.weixin.qq.com/s?__biz=MzA4NzgzMjA4MQ==&mid=2453457587&idx=1&sn=888c34f5f8d98895fc2ab12680ce6ced

AGI Hunt

关注AGI 的沿途风景！

最新文章

阿里推理模型来了！Marco-o1 发布即开源

重磅！OpenAI 要自己造浏览器了！

刚刚，OpenAI 发布红队测试白皮书：AI安全不再是黑盒！

DeepSeek-R1挑战GPT4和Claude，6分钟解决它们都无法破解的难题

斯坦福研究：9.5%的软件工程师在「摸鱼」，每年浪费900亿美元！

这个开源AI项目，让你零成本拥有私人研究助手！

Sam Altman谈OpenAI转型为营利公司的真相

字节跳动开源SeedEdit：「用嘴PS」成为现实！

Andrej Karpathy谈模型的奇葩命名

重磅！Neuralink加拿大获批，脑机接口临床试验正式启动

AlphaQubit：量子计算错误纠正的未来之光

揭秘：这个GPT 套壳应用是如何做到500万用户的？

吴恩达推出大模型游戏创作课程！

重磅！DeepSeek发布R1 推理模型，硬刚OpenAI o1

地球能养活1000 亿人口吗？

OpenAI 悄悄开启 full-O1 测试！

重磅！ChatGPT开启「眼睛」，实时摄像头对话来了！

印度新闻巨头ANI 怒告OpenAI：你偷我家的菜！

Anthropic发布新研究：为AI评估引入统计误差条！

OpenAI发布学生写作指南，终于教会了学生如何「正确」使用ChatGPT！

EEG脑机接口：用脑子来控制机器人！

马斯克：2026年AGI必到，Optimus替你接送孩子！

Windsurf：Cursor 的最大竞争对手来了！

Perplexity重磅推出购物助手：AI购物新时代来了？

Claude变身「claude酱」，和二次元宅对线开口就是「绝绝子」

重磅！OpenAI o1 或于本周发布，API 推迟至2025年！

200M 模型 SOTA 开源图像细节描述！

李开复的01.ai 用3百万造出GPT-4级对手！

AI奶奶专治电信诈骗：40分钟废话连篇，骗子气到爆粗口！

Grok 3 因证明「黎曼假设」而被暂停训练？！

NEO 重磅问世：第一位「全能」机器学习AI工程师！

MoE「现形记」：训练时按需使用，推理时全员出动？

llms.txt：AI时代的robots.txt！

llama-ocr 登顶Hacker News！

AGI 定义之争：DeepMind vs OpenAI vs Anthropic

走近科学之，17岁高中生的“神级Prompt”

来了！ChatGPT 推出桌面级编程助手！

Anthropic推出Claude 智能改进器，「一键优化」你的AI提示词！

谍战！OpenAI 派飞机侦查马斯克xAI 超算中心

重磅！OpenAI「Operator」明年一月发布！

LeCun被指剽窃！Marcus怒斥：我要告你！

重磅！马斯克或将影响特朗普新政府的AI监管政策

Hinton：别学AI，去当水管工吧！

软体机器人的「超级肌肉」来了：力举千倍重物，柔软如肌肤

Ilya Sutskever：预训练已到瓶颈！

Sam Altman的Worldcoin：用眼睛换币，84%人亏损！

重磅！OpenAI前CTO Murati新团队初具规模！挖角OpenAI成功？

独家解密！Lex Fridman与Anthropic CEO 5小时长谈：Claude 4.0、AGI 2026年或将到来！

再见GPT！你好，「o」！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉