AI Weekly『11月18-24日』：DeepSeek发布国内首个推理模型，Gemini新模型夺得榜首！

文摘 2024-11-24 10:27 美国

大家好，我是木易，一个持续关注AI领域的互联网技术产品经理，国内Top2本科，美国Top10 CS研究生，MBA。我坚信AI是普通人变强的“外挂”，所以创建了“AI信息Gap”这个公众号，专注于分享AI全维度知识，包括但不限于AI科普，AI工具测评，AI效率提升，AI行业洞察。关注我，AI之路不迷路，2024我们一起变强。

关于AI Weekly

马化腾谈及AI时说：“我们最开始以为这是互联网十年不遇的机会，但是越想越觉得这是几百年不遇的、类似发明电的工业革命一样的机遇，所以我们觉得非常重要。”

AI Weekly回来了！

“AI Weekly”是AI领域的前沿资讯周报，每周与你相约，精心筛选并总结过去一周内AI领域最重要、最具影响力的事件。这个专栏致力于打破信息壁垒，帮助你高效掌握最新动态，增强对AI技术及应用趋势的洞察力。

省流版摘要

DeepSeek推出R1-Lite预览版：DeepSeek发布推理模型DeepSeek-R1-Lite，在数学、编程等复杂逻辑任务中表现媲美o1-preview，并超越GPT-4o。模型已开放网页使用，正式版将开源并支持API调用。
昆仑万维推出中文逻辑推理模型“天工4.0 O1版”：昆仑万维宣布天工大模型4.0 O1版将于11月27日启动邀测，支持思考、计划和反思等能力。官方称这是国内首款中文逻辑推理模型，但发布时间与其他模型相近，实际表现有待验证。
夸克推出“学术搜索”功能：夸克上线“学术搜索”AI工具，每次回答引用10篇以上文献，支持生成学术大纲和PPT，提升学术研究效率。
OpenAI发布新版GPT-4o ：新版GPT-4o提升创意写作能力和文件处理表现，登顶大模型竞技场榜首，但仅领先谷歌一天。
谷歌发布Gemini-Exp-1121实验版：谷歌推出Gemini-Exp-1121实验版，在代码生成和推理任务上表现优异，再次登顶大模型竞技场榜首。
Mistral推出多模态AI模型Pixtral Large ：Mistral发布多模态模型Pixtral Large，在视觉数据、图表理解和数学推理领域超越GPT-4o，适用于研究、教育和商业用途。

1. DeepSeek推出R1-Lite预览版，推理能力媲美o1-preview

2024年11月20日，DeepSeek宣布其全新研发的推理模型DeepSeek-R1-Lite预览版正式上线。该模型采用强化学习训练，推理过程中包含大量反思和验证，思维链长度可达数万字。在数学、编程等复杂逻辑推理任务中，DeepSeek-R1-Lite展现出媲美OpenAI o1-preview的性能，并为用户呈现了o1未公开的完整思考过程。

在美国数学竞赛（AMC）中难度最高的AIME以及全球顶级编程竞赛（Codeforces）等评测中，DeepSeek-R1-Lite超越了GPT-4o等知名模型。值得注意的是，DeepSeek-R1-Lite目前仍处于迭代开发阶段，仅支持网页使用，暂不提供API调用。官方表示，正式版DeepSeek-R1模型将完全开源，并公开技术报告和部署API服务。

感兴趣的小伙伴可以翻看我这篇介绍文章：《国内首个对标o1的推理模型发布：DeepSeek-R1-Lite初体验！》。

2. 昆仑万维“发布”国内首款中文逻辑推理模型“天工4.0 O1版”

2024年11月18日，昆仑万维（开发天工AI的公司）官方宣布，其新一代具备推理能力的天工大模型4.0 O1版（英文名：Skywork O1）将于2024年11月27日启动邀请测试。作为支持中文逻辑推理的模型，它能够输出包含思考、计划和反思等能力的答案。

虽然昆仑万维强调天工大模型4.0 O1版是国内第一款具有中文逻辑推理能力的模型，但其实这并不是事实。首先，月之暗面（开发Kimi的公司）早在两天前（11月16日）就已官宣了其数学推理模型k0-math。其次，和昆仑万维、月之暗面停留在PPT上的发布不同，DeepSeek（中文名：深度求索）已于2024年11月20日真正发布了推理模型DeepSeek-R1-Lite，该模型在各项基准测试中表现优秀，现已面向所有用户免费开放使用，每用户每天使用数量限制为50次。

3. 夸克推出AI产品“学术搜索”

2024年11月18日，夸克发布AI产品“学术搜索”，旨在提升学术工作中的信息获取、创作和处理效率。该产品依托AI技术和亿级学术文献资源，能够在每次AI回答中引用超过10篇文献内容，实现多维度的信息归纳和知识整理，确保搜索内容的准确性。

在创作写作方面，夸克学术搜索可根据用户提出的学术问题，结合研究背景、市场现状和发展趋势等因素，智能生成学术大纲，并支持一键制作PPT，进一步提高学术工作效率。

4. OpenAI发布新版GPT-4o，重夺竞技场榜首

2024年11月20日，OpenAI官宣了新版本的GPT-4o模型，此次更新主要提升了该模型的创意写作能力，使其生成的文本更加自然、吸引人且相关性更高。此外，模型在处理上传文件时，能够提供更深入的见解和全面的响应。

最新版本的GPT-4o模型在大模型竞技场中重新夺回榜首位置，超越了此前排名第一的谷歌Gemini。

5. 谷歌发布新模型Gemini-Exp-1121，重夺竞技场榜首

2024年11月21日，谷歌发布了最新实验版模型Gemini-Exp-1121，在大模型竞技场中重新夺回榜首位置（直到我写这篇文章时，Gemini-Exp-1121仍为第一名）。此前，OpenAI的GPT-4o模型刚刚登顶，但仅领先一天，详情见上一条信息。

Gemini-Exp-1121在代码生成、推理能力和视觉理解等方面表现出色，尤其在复杂提示词的风格控制下，与o1-preview和New Sonnet 3.5等模型水平相当。在经典的逻辑推理题目中，Gemini-Exp-1121的回答更加全面且详细，展示了其强大的推理能力。

6. Mistral发布Pixtral Large多模态AI模型，超越GPT-4o

2024年11月18日，被网友誉为“欧洲OpenAI”的Mistral AI公司宣布推出全新的多模态AI模型Pixtral Large。该模型拥有1240亿参数，基于Mistral Large 2构建，专注于处理文本和图像数据。在MathVista、DocVQA和VQAv2等多模态基准测试中，Pixtral Large表现出色，尤其在MathVista中取得了69.4%的准确率，超越了GPT-4o和Gemini-1.5 Pro。

Pixtral Large配备了1230亿参数的多模态解码器和10亿参数的视觉编码器，支持128K的上下文窗口，能够处理至少30张高分辨率图像。该模型在视觉数据处理、复杂推理和图表理解方面展现了强大的能力。目前，Pixtral Large已在Mistral研究许可证和商业许可证下提供，适用于研究、教育以及商业用途。

精选推荐

都读到这里了，点个赞鼓励一下吧，小手一赞，年薪百万！😊👍👍👍。关注我，AI之路不迷路，原创技术文章第一时间推送🤖。

http://mp.weixin.qq.com/s?__biz=MzkwMzYzMTc5NA==&mid=2247492093&idx=1&sn=343c57e614518abbee2c0e99f0f15f22

AI信息Gap

AI信息差，让一部分人先AI起来。

一文带你了解红队测试！

AI眼中的麦琳...

国内首个对标o1的推理模型发布：DeepSeek-R1-Lite初体验！

ChatGPT高级语音模式正在向Web网页端推出！

ChatGPT Search VS Kimi探索版：AI搜索哪家强？！

AI Weekly『11月11-17日』：Kimi发布新一代数学推理模型，腾讯推出AI工作台ima！

谷歌Gemini发布iOS版App，live语音聊天免费用！

『深度分析』AI搜索的3大使用场景！

马斯克的xAI已开通网页版！目前免费！附详细教程和初体验

OpenAI花费千万美元购买了这个域名！

AI Weekly『11月4-10日』: Anthropic发布Claude 3.5 Haiku，腾讯开源混元-Large模型！

Sam Altman：年底将有重磅更新，但不是GPT-5！

马斯克发福利，每月免费25美元xAI API！附详细教程

我找了8个AI搜索工具总结2024美国大选，哪个最强？

Apple Intelligence体验报告/使用教程（一）：写作工具篇

ChatGPT Search浏览器插件手把手教学！OpenAI官方出品！

ChatGPT Search重磅发布！OpenAI牌搜索引擎来了！

聊一聊ChatGPT的两个更新：不起眼，但很重要！

一文记录Apple Intelligence从开始到设置全过程！

Apple Intelligence正式发布，送你这份完全攻略！

OpenAI CEO山姆·奥特曼亲自辟谣新模型Orion：假新闻失控了！

刚刚，Claude发布了数据分析功能！附详细教程！

OpenAI低调发布多智能体工具Swarm：让多个智能体协同工作！

重磅！Anthropic发布Claude 3.5 Haiku、升级版Sonnet和计算机自动化操作功能！

Claude Financial Data Analyst：基于Claude的金融数据分析工具！免费开源！

ChatGPT官方桌面客户端的平替，Github 52.7K Stars！支持Mac、Win、Linux！

刚刚，ChatGPT推出Windows客户端！

Kimi VS 智谱 VS 360：推理型AI搜索哪家强？！

盘点5个你应该知道的ChatGPT近期更新！免费实时语音终于来了！

OpenAI提示词生成工具详解！一键生成提示词！

『深度分析』Kimi版o1来了！Kimi探索版全面解读！

准备进入AI第三阶段：OpenAI推出AI Agent基准MLE-bench！

AI教父荣获2024诺贝尔物理学奖：杰弗里·辛顿和他的深度学习之路！

公众号GPT-4o mini免费AI聊天机器人已恢复！

Apple Intelligence将于10月28日发布，ChatGPT集成推迟！

『建议收藏』ChatGPT Canvas功能进阶使用指南！

OpenAI为ChatGPT推出Canvas功能，对标Claude Artifacts！

媲美GPT-4o mini的小模型，Meta Llama 3.2模型全面解读！

ChatGPT实时语音将于本周向免费用户推出：OpenAI DevDay 2024详细解读

使用OpenAI最新模型o1的6种方式，总有一种适合你！

现实版宫斗剧《OpenAI传》，正在上演！

关于ChatGPT实时语音功能，你需要知道的15点总结！

重磅！ChatGPT实时语音终于要来了！附详细使用说明

让AI激发创作力：OpenAI分享5位专业作家利用ChatGPT写作的案例技巧

『深度长文』Anthropic推出全新“上下文检索”：大幅增加RAG检索准确性！

国内支付宝开通ChatGPT Plus和Claude Pro 2024最新教程！

美联储四年来首次降息意味着什么？来看看新模型o1怎么回答！

注意，传统的提示工程对新模型o1可能失效：来自OpenAI官方的4条提示词建议！

免费的新模型o1 mini即将到来：OpenAI正在逐步开放！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉