亲民且开源！阿里推理模型Marco-o1震撼发布！

科技 2024-11-22 14:53 北京

阿里发布开源推理大模型Marco-o1！

里

作者丨不寒

编辑丨刘欢

就在刚刚，阿里巴巴国际MarcoPolo Team在hugging face平台发布全新开源大模型Marco-o1：面向开放式解决方案的开放式推理模型！

是一款Size为7.62B ，精度BF16的轻量级模型。

这个开源且上手简单的模型，不仅能解决标准问题，更重要的是能够处理那些没有标准答案、难以量化的开放性问题。

这或许就是AI走向真正智能的关键一步，毕竟，人类面对的大多数问题，都不会有标准答案。

在性能测试中，Marco-o1在MGSM英文和中文数据集上的准确率分别提升了6.17%和5.60%，这一跃升在AI领域是前所未有的。

它在翻译任务上的表现也很突出，首次将大型推理模型（LRM）应用于机器翻译任务，探索多语言和翻译领域的推理时间扩展规律。

此前，该团队推出Marco-MT模型就在翻译中展现出了惊人的准确性和文化敏感性。这次Marco-o1能力也更为突出，它能够将口语化的表达“这个鞋拥有踩屎感”优雅地转化为“This shoe has a comfortable sole”，翻译到你的心趴上。

简单总结一下模型几大亮点：

多领域应用：Marco-o1不仅专注于有标准答案的领域，如数学、物理和编程，还致力于解决没有标准答案的开放性问题。

先进技术集成：模型采用了思维链（Chain of Thought, CoT）微调、蒙特卡罗树搜索（Monte Carlo Tree Search, MCTS）和反思机制等先进技术，以提高AI处理复杂问题的能力。

推理能力提升：通过这些技术的结合，Marco-o1在解决复杂问题时表现出色，类似于从简单的选择题进化到复杂的论文写作。

性能表现：在MGSM英文和中文数据集上，Marco-o1显示出了显著的性能提升，准确率分别提高了6.17%和5.60%。

翻译能力：在机器翻译任务中，Marco-o1展现了惊人的实力，能够准确理解和翻译俚语表达，显示出其在多语言和翻译领域的潜力。

易于使用：Marco-o1提供了快速上手指南，用户可以通过几行代码直接加载模型，并使用vLLM加速推理。

开源贡献：Marco-o1的开源将为AI社区带来新的可能性，推动AI技术的发展，尤其是在解决没有标准答案的问题上。

亲民模型，朝我们走近一步

老实说，MarcoPolo Team的模型，最能打动人的不仅是技术与开源，更是在易用性和开源性上做出了表率。

Marco-o1提供了简单的代码加载模型，使得即便是非专业的用户也能快速上手。

其开源的性质，意味着全球的研究人员、开发者、有兴趣的任何人都可以访问和利用这一技术，共同推动AI技术的进步，也展现了公司在推动AI推理能力发展方面的决心和实力。

团队提及，OpenAI推出的开创性的o1模型，以其卓越的推理能力而闻名。该模型在AIME、CodeForces等平台上展现出了杰出的表现，超越了其他领先的模型。

MarcoPolo Team受此成功的启发，旨在进一步推动大型语言模型（LLMs）的界限，增强其推理能力，以应对复杂的真实世界挑战。

团队也在model card页面详细解释了这个开源模型：

Marco-o1不仅关注具有标准答案的学科，例如数学、物理和编码（这些学科非常适合强化学习 (RL)），而且还更加重视开放式解决方案。

旨在解决：“o1 模型能否有效地推广到缺乏明确标准且奖励难以量化的更广泛领域？”

目前，Marco-o1 大型语言模型 (LLM) 由思路链 (CoT) 微调、蒙特卡洛树搜索 (MCTS)、反射机制和_创新推理策略_提供支持，针对复杂的现实世界问题解决任务进行了优化。

MarcoPolo团队过往的主要成果与来头

Marco翻译大模型：2024年10月，阿里国际发布了Marco翻译大模型，支持中、英、日、韩、西、法等15种全球主流语言。

该模型在BLEU自动评测指标上，超越了市面上的其他翻译产品，如Google翻译、DeepL和GPT-4。其优势在于能够基于语境进行精准翻译，避免字面翻译导致的歧义。

MarcoPolo-VL多模态大模型：该模型具备精准的“视觉”能力，能够进行物品识别和推荐。

2023年4月，阿里国际在内部成立了“AI Business”，MarcoPolo团队隶属于AI Business。

当下，阿里国际的AI模型已在阿里巴巴的跨境电商平台上大规模应用，这些模型主要可以帮助商家和消费者克服语言障碍，无论是在挑选商品、还是上架、支付等方面都能提升用户体验。