首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

Mistral放大招！124B多模态巨无霸登场，免费版ChatGPT震撼突袭

科技 2024-11-19 15:24 北京

新智元报道

编辑：编辑部 HYj

【新智元导读】Mistral AI深夜两弹更新！124B多模态巨无霸大幅超越GPT-4o，还有全新升级的Le Chat完全开放了，Flux图像生成、网络搜索、Canvas强大功能，免费用。

Mistral AI终于放大招了！一连发布两大更新——

Pixtral Large：前沿级124B多模态模型，用于驱动新Le Chat。

全新Le Chat：具备网页搜索、Canvas、图像生成、图像理解等功能——而且所有功能免费提供！

Mistral的CEO兼联创Arthur Mensch宣布道：「此次发布是一个重要的里程碑」！

现已可在官网上体验Le Chat的使用。

体验地址：https://chat.mistral.ai/chat

Pixtral Large：地表最强开源多模态来了？

在官博中，研究人员总结了Pixtral Large的5大亮点：

SOTA的多模态性能
在MathVista、DocVQA、VQAv2等任务上达到SOTA水平
在不影响文本处理性能的前提下对Mistral Large 2进行扩展
1230亿参数的多模态解码器，10亿参数的视觉编码器
128K上下文窗口长度：可容纳至少30张高分辨率图像

具体来说，Pixtral Large是Mistral多模态系列的第二个模型，基于Mistral Large 2构建，有1240亿参数。该模型能够理解文档、图表和自然图像，同时保持了Mistral Large 2卓越的纯文本理解能力。

Pixtral Large拥有128K上下文窗口长度，意味着它可以处理多达30张高分辨率图像或约300页书籍的输入，这一能力与OpenAI的GPT系列顶级模型相当。

该模型在Mistral研究许可证（MRL）下可用于研究和教育用途。模型及其权重可在Hugging Face平台上免费下载。

下载地址：https://huggingface.co/mistralai/Pixtral-Large-Instruct-2411/tree/main

性能评测

在评估视觉数据复杂数学推理能力的MathVista测试中，Pixtral Large获得了69.4的高分，超越了所有其他模型。

在评估复杂图表和文档推理能力的ChartQA和DocVQA测试中，Pixtral Large超过了GPT-4o和Gemini-1.5 Pro。

最后，Pixtral Large在反映多模态大语言模型实际使用场景的MM-MT-Bench测试中，表现也十分亮眼——凭借着7.4的得分，一举超越了新版Claude 3.5 Sonnet、Gemini-1.5 Pro和最新的GPT-4o。

定性实验

1. 多语言OCR和推理

提示：

我买了咖啡和香肠。我需要付多少钱？加上18%的小费。

回答：

要计算包含18%小费的总金额，请按以下步骤：

1. 计算咖啡和香肠的费用：

- 2杯拿铁玛奇朵：2 * 4.50 CHF = 9.00 CHF- 1份猪排：22.00 CHF- 咖啡和香肠的总费用：9.00 CHF + 22.00 CHF = 31.00 CHF

2. 计算18%的小费：

- 小费：31.00 CHF * 0.18 = 5.58 CHF

3. 将小费加入总费用：

- 应付总额：31.00 CHF + 5.58 CHF = 36.58 CHF

因此，需要支付总计36.58 CHF。

2. 图表理解

提示：

dark dragon什么时候开始出现问题？

回答：

「dark-dragon-50」模型的训练损失在大约10,000步时开始表现出明显的不稳定性。在这一点上，损失值表现出明显的峰值，这种不稳定性持续到大约20,000步时又有另一个主要峰值。这些峰值意味着，「dark-dragon-50」模型的训练过程在大约10,000步时开始遇到问题。

3. 其他案例

提示：

哪些公司使用Mistral AI开发的模型？

回答：

根据图片显示，使用Mistral AI模型的公司包括：BNP Paribas、Brave、Cloudflare、CMA CGM和Front。

「白嫖版」ChatGPT，图像生成搜索100%免费

全新升级后的Le Chat，能够支持图像生成、网络搜索、Canvas、PDF上传等强大功能。

关键是，完全免费。

你可以将其用作创意伙伴，教它执行特定的任务，并把它作为编码copilot。

基本上，任何日常中的任务，它都能胜任。

官方博文中，简要总结了Le Chat新的能力：

带引用的Web搜索
用于构思、文内编辑、导出的Canvas
最先进的文档和图像理解，由Pixtral Large 2加持
图像生成，直达Flux 1.1 Pro
从模型到输出的全面集成
由推测性编辑（speculative editing）提供更快的响应

那么，Le Chat和当前备受欢迎的聊天机器人/搜索助手区别都有哪些：

接下来，具体看下Le Chat带来的新能力。

网络搜索

Le Chat很大一部分用户是学生和专业人士，将其用于学习、研究和工作。

为了让其发挥更大的效力，Mistral AI团队通过互联网搜索增强了Le Chat的训练知识。

而且，它还得到了Pixtral Large 2加持，能够访问最新知识和事件。

在下面的实例中，一位营销团队的成员，用Le Chat来评估医疗保健AI市场。

AI给出的每个结果末，会附上相应的参考来源，供再次查证。

Canvas（画布）

前段时间，OpenAI曾发布了Canvas，目的是让AI与人类在ChatGPT中可以共同协作。

类似地，Le Chat中的Canvas，也充当着这个功能。

当你不仅仅需要的是对话，开始构思时，它会在聊天窗口中弹出。

如下，Mistral AI的产品团队在为Canvas推出时，创建了一个如何让大家使用新功能的演示。

左边的Canvas中给出了关于用户使用、管理等各种指标。

若是还有另外的要求，直接在右边的聊天界面要求——用 mockdata创建一个 React 仪表盘，显示这些指标。

而且，你还可以针对AI生成的代码进行再编辑，比如添加文本描述。

通过Canvas你可以创建文档、写代码等等，它能为你提供无限创造性思维。

快速准确理解文档

另外，Le Chat还能处理大型、复杂的PDF文档和图像，并对其进行分析和总结。

具体操作，和大家日常用的其他AI流程一样。

值得一提的是，它是由最强大的多模态Pixtral Large加持。

不如看看，Le Chat究竟有多强大？

上传一篇由爱因斯坦、波多尔西和罗森在1935年发表的著名量子纠缠论文，里面包含了很多复杂的公式。

然后让AI对论文进行信息提取、总结，和语义理解。

比如，基本的问题——论文作者是谁，并让它将论文总结成三段话。

甚至，你可以让它列出关键公式，谈谈这篇论文影响力。

图像生成

Mistral与Black Forest Labs合作，将他们的图像生成模型FLUX1.1[pro]引入了Le Chat。

FLUX1.1[pro]生成图像风格案例

智能体自动化重复工作流

如果你发现自己经常重复使用某些提示词，或者发现某些创造性工作的模式可以被自动化，可以将这些工作流程编码为代理。

常见的使用场景包括，扫描收据进行费用报告、为冗长的会议记录创建摘要、发票处理。

Le Chat智能体能够和团队成员共享，推进工作流程。

你可以创建角色扮演对话智能体。比如让智能体模仿单口喜剧演员Ali Wong和Jimmy Yang的风格。

你还可以创建一个只说法语的智能体。你需要为这个智能体设置特定的指令，并使用少量示例学习，确保它理解只用法语进行交流的要求。

你还可以创建一个只输出Python代码的智能体，并要求它不提供任何解释。这在你需要生成可以轻松复制粘贴的代码片段时非常有用，避免了模型通常提供的额外解释性文本。

此外，你可以在工作流中利用多个智能体。以下是一个生成数据分析报告的工作流，工作流共包含数据分析规划、代码生成与执行、分析报告总结三步，每一步都有一个单独的智能体。

数据分析规划：数据分析规划智能体编写一份全面的数据分析计划，概述分析数据所需的步骤。

代码生成与执行：对于分析计划中的每个步骤，Python智能体生成相应的代码。然后，Python智能体执行生成的代码，以执行指定的分析。

分析报告总结：基于已执行代码的结果，总结智能体编写一份分析报告。报告总结了从数据分析中得出的发现和洞察。

参考资料：

https://mistral.ai/news/mistral-chat/

https://mistral.ai/news/pixtral-large/

http://mp.weixin.qq.com/s?__biz=MzI3MTA0MTk1MA==&mid=2652541794&idx=1&sn=9a0591d54a4f6fef50e3980c8492af50

智能+中国主平台，致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展，关注人机融合、人工智能和机器人革命对人类社会与文明进化的影响，领航中国新智能时代。

最新文章

周鸿祎黑客短剧震撼首秀，直接带火纳米搜索！搜学写创，开启AI搜索3.0时代

数字孪生心脏全球首次实现0.84秒超实时模拟！智源突破计算极限，180倍性能提升

代码模型自我进化超越GPT-4o蒸馏！UIUC伯克利等提出自对齐方法 | NIPS 2024

当AI创造AI，就是库兹韦尔「奇点」临近时？人类正处于自我改进AI爆炸边缘

招人！新智元邀你勇闯ASI之巅

十年再登巅峰！刚刚，Ilya和GAN之父斩获NeurIPS 2024时间检验奖

AI卷翻科研！DeepMind 36页报告：全球实验室被「AI科学家」指数级接管

AI造芯Nature论文遭围攻，谷歌发文硬刚学术抹黑！Jeff Dean怒怼：你们连模型都没训

不是RNN的锅！清华团队深入分析长上下文建模中的状态崩溃，Mamba作者点赞

一文看尽Meta开源大礼包！全面覆盖图像分割、语音、文本、表征、材料发现、密码安全性等

招人！新智元邀你勇闯ASI之巅

Sora半夜泄露3小时，物理效果惊人！奥特曼急拔网线，艺术家抗议被白嫖

逃回大厂！谷歌天才科学家Yi Tay——639天创业血泪史

打破LLM数据孤岛！Anthropic革命性MCP让大模型解锁全网数据，AGI要来了？

AI视频两巨头开战！Runway秒生现实大片，Luma动嘴创作电影

「学术版ChatGPT」登场！Ai2打造科研效率神器OpenScholar，让LLM帮你搞定文献综述

揭示Transformer「周期建模」缺陷！北大提出新型神经网络FAN，填补周期性特征建模能力缺陷

UC伯克利：给大模型测MBTI，Llama更敢说但GPT-4像理工男

招人！新智元邀你勇闯ASI之巅

GAN之父新冠后惊传罹患双重顽疾！听力减退心动过速，全网求医

OpenAI怒斥Scaling撞墙论！o1已产生推理直觉潜力巨大

指令跟随大比拼！Meta发布多轮多语言基准Multi-IF：覆盖8种语言，超4500种任务

世界模型挑战赛，单项奖金10000美元！英伟达全新分词器助力下一帧预测

招人！新智元邀你勇闯ASI之巅

Claude 3.5两小时暴虐50多名专家，编程10倍速飙升！但8小时曝出惊人短板

新晋AI编程神器干翻Cursor！首创实时感知无限用，估值12.5亿华人初创震惊AI界

扩散模型=进化算法！生物学大佬用数学揭示本质

招人！新智元邀你勇闯ASI之巅

美国教授痛心：UC伯克利GPA 4.0计算机本科生，毕业即失业？ML博士直呼太卷后悔转行

英特尔错失AI芯片浪潮，从放弃收购英伟达开始

一只暹罗猫竟是论文作者！谷歌学术20岁，创始人首次公开最魔幻学术故事

招人！新智元邀你勇闯ASI之巅

续命Scaling Law？世界模型GPT-4o让智能体超级规划，OSU华人一作

5年浴火，800余岁巴黎圣母院重生！马斯克激动转发，AI数字建模创奇迹

首个可保留情感的音频LLM！Meta重磅开源7B-Spirit LM，一网打尽「音频+文本」多模态任务

机器人训练数据不缺了！英伟达团队推出DexMG：数据增强200倍

招人！新智元邀你勇闯ASI之巅

全面进攻谷歌！OpenAI被曝打造浏览器，已挖Chrome创始大牛

预定下一个诺奖级AI？谷歌量子纠错AlphaQubit登Nature，10万次模拟实验创新里程碑

宝可梦GO「偷家」李飞飞空间智能？全球最强3D地图诞生，150万亿参数解锁现实边界

OpenAI薪酬大曝光！奥特曼身价145亿，年薪只有55万

世界最大AI Agent生态系统！微软推出全新「自主AI智能体」，10万企业工作流被改变

RAG没有银弹！四级难度，最新综述覆盖数据集、解决方案，教你「LLM+外部数据」的正确使用姿势

招人！新智元邀你勇闯ASI之巅

OpenAI看好的方向，文心智能体技术抢先爆发！

「全球最严榜单」，阶跃拿下中国TOP 1！杀入世界前五，超过GPT-4o紧跟o1-mini

收敛速度最高8倍，准确率提升超30%！华科发布MoE Jetpack框架 | NeurIPS 2024

405B大模型也能线性化！斯坦福MIT最新研究，0.2%训练量让线性注意力提分20+

招人！新智元邀你勇闯ASI之巅

美国AI曼哈顿计划793页文件曝光！全力研发AGI，十大战略直指中国

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉