亲民且开源!阿里推理模型Marco-o1震撼发布!

科技   2024-11-22 14:53   北京  

阿里发布开源推理大模型Marco-o1!




作者丨不寒

编辑丨刘欢



就在刚刚,阿里巴巴国际MarcoPolo Team在hugging face平台发布全新开源大模型Marco-o1:面向开放式解决方案的开放式推理模型!

是一款Size为7.62B ,精度BF16的轻量级模型。

这个开源且上手简单的模型,不仅能解决标准问题,更重要的是能够处理那些没有标准答案、难以量化的开放性问题。
这或许就是AI走向真正智能的关键一步,毕竟,人类面对的大多数问题,都不会有标准答案。
在性能测试中,Marco-o1在MGSM英文和中文数据集上的准确率分别提升了6.17%和5.60%,这一跃升在AI领域是前所未有的。
它在翻译任务上的表现也很突出,首次将大型推理模型(LRM)应用于机器翻译任务,探索多语言和翻译领域的推理时间扩展规律。
此前,该团队推出Marco-MT模型就在翻译中展现出了惊人的准确性和文化敏感性。Marco-o1能力也更为突出,它能够将口语化的表达“这个鞋拥有踩屎感”优雅地转化为“This shoe has a comfortable sole”,翻译到你的心趴上。
简单总结一下模型几大亮点:
多领域应用:Marco-o1不仅专注于有标准答案的领域,如数学、物理和编程,还致力于解决没有标准答案的开放性问题。
先进技术集成:模型采用了思维链(Chain of Thought, CoT)微调、蒙特卡罗树搜索(Monte Carlo Tree Search, MCTS)和反思机制等先进技术,以提高AI处理复杂问题的能力。
推理能力提升:通过这些技术的结合,Marco-o1在解决复杂问题时表现出色,类似于从简单的选择题进化到复杂的论文写作。
性能表现:在MGSM英文和中文数据集上,Marco-o1显示出了显著的性能提升,准确率分别提高了6.17%和5.60%。
翻译能力:在机器翻译任务中,Marco-o1展现了惊人的实力,能够准确理解和翻译俚语表达,显示出其在多语言和翻译领域的潜力。
易于使用:Marco-o1提供了快速上手指南,用户可以通过几行代码直接加载模型,并使用vLLM加速推理。
开源贡献:Marco-o1的开源将为AI社区带来新的可能性,推动AI技术的发展,尤其是在解决没有标准答案的问题上。

亲民模型,朝我们走近一步

老实说,MarcoPolo Team的模型,最能打动人的不仅是技术与开源,更是在易用性和开源性上做出了表率。
Marco-o1提供了简单的代码加载模型,使得即便是非专业的用户也能快速上手。
其开源的性质,意味着全球的研究人员、开发者、有兴趣的任何人都可以访问和利用这一技术共同推动AI技术的进步,也展现了公司在推动AI推理能力发展方面的决心和实力。
团队提及,OpenAI推出的开创性的o1模型,以其卓越的推理能力而闻名。该模型在AIME、CodeForces等平台上展现出了杰出的表现,超越了其他领先的模型。
MarcoPolo Team受此成功的启发,旨在进一步推动大型语言模型(LLMs)的界限,增强其推理能力,以应对复杂的真实世界挑战。
团队也在model card页面详细解释了这个开源模型:
Marco-o1不仅关注具有标准答案的学科,例如数学、物理和编码(这些学科非常适合强化学习 (RL)),而且还更加重视开放式解决方案。
旨在解决:“o1 模型能否有效地推广到缺乏明确标准且奖励难以量化的更广泛领域?”
目前,Marco-o1 大型语言模型 (LLM) 由思路链 (CoT) 微调、蒙特卡洛树搜索 (MCTS)、反射机制和_创新推理策略_提供支持,针对复杂的现实世界问题解决任务进行了优化。

MarcoPolo团队过往的主要成果与来头
Marco翻译大模型:2024年10月,阿里国际发布了Marco翻译大模型,支持中、英、日、韩、西、法等15种全球主流语言。
该模型在BLEU自动评测指标上,超越了市面上的其他翻译产品,如Google翻译、DeepL和GPT-4。其优势在于能够基于语境进行精准翻译,避免字面翻译导致的歧义。
MarcoPolo-VL多模态大模型:该模型具备精准的“视觉”能力,能够进行物品识别和推荐。
2023年4月,阿里国际在内部成立了“AI Business”,MarcoPolo团队隶属于AI Business。
当下,阿里国际的AI模型已在阿里巴巴的跨境电商平台上大规模应用,这些模型主要可以帮助商家和消费者克服语言障碍,无论是在挑选商品、还是上架、支付等方面都能提升用户体验。

阅读


END

亿欧网
科技与产业创新服务平台
 最新文章