大模型月度回顾 · 2024年11月

文摘 2024-12-10 11:11 中国香港

本文目录（按时间先后排序）：

点击下方卡片，关注“自动驾驶之星”

这里有一群奋斗在自动驾驶量产第一线的小伙伴等你加入

大公司

腾讯开源MoE模型「混元Large」和3D生成大模型「Hunyuan3D-1.0」

时间：11月5日
介绍：
https://mp.weixin.qq.com/s/rHLrJwICzMXP_kqqxhxNBQ

腾讯混元宣布其最新的MoE模型“混元Large”和3D生成大模型“Hunyuan3D-1.0”正式开源。这两个模型旨在支持企业及开发者在精细化调整和部署等方面的多样化需求，并且可以在HuggingFace、Github等技术社区直接下载，免费且可用于商业用途。

混元Large模型以其389B的总参数量和52B的激活参数量，成为开源领域参数规模最大、效果最好的MoE模型之一，而Hunyuan3D-1.0则是业界首个同时支持文字、图像生成3D的开源大模型，标志着腾讯在大模型技术开放和应用实践方面迈出了重要一步。

Google 启动测试全新 AI 工具 “Learn About”

时间：11月11日
介绍：
https://learning.google.com/experiments/learn-about/signup

Google 最近推出了一款名为“Learn About”的实验性AI工具，它基于今年春天发布的 LearnLM AI 模型构建。

这款工具与常见的聊天机器人如Gemini和ChatGPT有所不同，它更侧重于提供教育性和教科书风格的回应，以指导用户了解新主题。Learn About在回答问题时，会包含更多的视觉和互动元素，并采用教育格式化的方式，例如通过添加“为什么重要”和“构建词汇”等教科书风格的框来提供额外的上下文信息。在测试中，Learn About与Google Gemini相比，更倾向于引用教育网站Physics Forums的图片，并添加相关学习内容，而不仅仅是提供事实和定义。

字节豆包推出最新图像编辑模型 SeedEdit

时间：11月11日
官网：
https://team.doubao.com/seededit
介绍：
https://mp.weixin.qq.com/s/xUykBSAAnXf21w2THBWwpw

字节跳动豆包大模型团队推出了一款名为 SeedEdit 的最新图像编辑模型，这标志着国内首个产品化的通用图像编辑模型的诞生。SeedEdit 能够通过简单的自然语言指令，实现对图像的多样化编辑操作，包括更换背景、转换风格以及在特定区域增加或删除元素等，无需复杂的描边涂抹过程。

SeedEdit 的核心技术在于其扩散模型，它能够在不引入新参数的情况下，将图像生成模型转化为图像编辑模型。这一创新使得SeedEdit在图像编辑的通用性、可控性和高质量上实现了新的突破，用户只需输入文本提示，即可实现精准的图像编辑，大幅提升了编辑效率并降低了技术门槛。

百度发布文心iRAG和无代码「秒哒」

时间：11月12日
介绍：
https://mp.weixin.qq.com/s/cNAV4HETsoF2VqO14SJjaA

在百度世界2024大会上，百度创始人李彦宏宣布了两项重要的AI技术创新：检索增强的文生图技术（iRAG）和无代码工具“秒哒”。

文心iRAG技术旨在解决大模型在图像生成中常见的幻觉问题，通过结合百度搜索的图片资源和强大的基础模型能力，能够生成超真实的图片，显著提升了AI在图像生成方面的实用性和准确性。

“秒哒”则是一款无代码工具，它赋予每个人无需编写代码即可实现任意想法的能力。这款工具通过无代码编程、多智能体协作和多工具调用三大特性，使用户能够用自然语言构建一整套系统，从而开启了一个仅凭想法就能创造应用的新时代。

阿里开源通义千问代码模型Qwen2.5-Coder全系列

时间：11月12日
开源：
https://qwenlm.github.io/zh/blog/qwen2.5-coder-family/

阿里云通义大模型团队宣布开源其通义千问代码模型 Qwen2.5-Coder 全系列，共包括六款不同尺寸的模型。该系列模型以其强大、多样和实用性为特点，旨在推动开源代码语言模型（Open CodeLLMs）的发展。

Qwen2.5-Coder 系列模型覆盖了从0.5B到32B的六个主流模型尺寸，满足不同开发者的需求，并为研究社区提供了丰富的实验资源。这些模型在代码生成、代码修复、代码推理以及多编程语言支持等方面均展现出色的性能，特别是在人类偏好对齐方面也显示出优势。其中，Qwen2.5-Coder-32B-Instruct作为系列中的旗舰模型，在多个流行的代码生成基准测试中取得了开源模型中的最优成绩，与闭源模型GPT-4o相比也展现出竞争力，成为全球最强的开源代码模型之一。

百度小度科技推出首款内置中文大模型的原生AI眼镜

时间：11月12日
介绍：
https://dumall.baidu.com/activity/unify/shijiedahui

百度旗下小度科技推出了全球首款内置中文大模型的原生AI眼镜，这款AI眼镜以其45克的轻巧设计和5小时的连续播放能力，为用户提供了随时可用的AI交互体验。它不仅具备基本的语音交互功能，还能在多种场景中扮演不同的角色，如AI导游、AI百科、AI翻译、AI助理和AI音乐DJ，极大地扩展了智能眼镜的应用范围。

小度AI眼镜展现了小度在AI技术与硬件融合方面的深入探索。这款眼镜不仅是一款穿戴设备，更是一个集成了多种智能功能的私人助理，能够在旅游、学习、工作和娱乐等多个场景中提供个性化服务。它的出现，将推动智能眼镜市场进入一个新的发展阶段，同时也体现了小度在智能硬件领域的技术积累和创新能力。

阿里推出用于全球 B2B 采购的 AI 搜索引擎 Accio

时间：11月12日
介绍：
https://www.accio.com/home
官网：
https://www.accio.com/

阿里巴巴推出了一款名为 Accio 的全球B2B采购AI搜索引擎，旨在帮助用户准确解读需求并利用B2B知识进行精准匹配。Accio 的主要目标用户群体是欧美地区的小型企业，它通过实时数据为用户提供产品灵感，支持通过文本或图像搜索所需的物资，并具备比价功能，使得用户能够比较数以百万计的最佳销售和竞争产品。

这款搜索引擎的推出，旨在帮助用户将创意转化为商业价值，目前已有超过10万买家加入使用。Accio 的核心功能包括产品灵感、精准匹配、超级比较和Accio页面，它能够提供AI验证的产品和供应商信息，为每个SKU提供详细信息。通过Accio，用户可以更便捷地找到经过验证的产品和供应商，从而简化采购流程，降低成本，并最终实现业务增长。

腾讯元宝2.0上线

时间：11月14日
介绍：
https://mp.weixin.qq.com/s/9CfdKnDRfpqlfWaZs4rg9Q

腾讯元宝2.0版本正式上线，带来了全面升级的界面和新交互体验。此次更新包括对话列表的焕新，使得用户能够更轻松地查找历史对话和使用过的智能体，以及新增的AI应用专属板块，集结了AI搜索、AI阅读、创意绘画等五大应用，满足用户的多维度创作需求。同时，AI搜索功能也得到了升级，整合了微信视频号、QQ音乐等特色信息资源，提供更智能便捷的搜索服务。

在混元模型方面，腾讯元宝2.0基于新一代大模型“混元turbo”进行了架构升级，性能大幅提升，训练和推理效率提高了一倍。该模型支持多种模态理解和生成，是国内首个自研MoE多模态大模型，能够处理任意长宽比及最高7K分辨率的图片理解分析。此外，腾讯元宝2.0还将融入腾讯文档、电脑管家、搜狗输入法等生态产品，使得元宝的应用场景更加广泛，为用户提供更原生的场景融合体验。

微信发布 AI 3.0 智能对话系统「小微Brain」

时间：11月15日
介绍：
https://mp.weixin.qq.com/s/Pc0f851h58zNW93janT2Mw

微信对话开放平台升级至全新的AI 3.0智能对话系统“小微Brain”。新系统使得上传知识后，用户可以即刻体验到“即问即答”的服务，大大提升了对话的便捷性和智能性。在AI技术的辅助下，构建聊天机器人（chatbot）变得更加轻松和智能，同时，系统还能够对高频问题进行分类独立管理，并支持智能提取和挖掘，确保服务的精准可靠和易于维护。

“小微Brain”架构下的智能问答升级包括多引擎对话中控，使得不同尺寸模型在对话过程中能够各司其职，响应速度更快。此外，系统还提供了全新的文档问答功能，通过RAG技术，更好地处理知识密集型任务，以及智能问答抽取和问法生成，减轻用户编写话术的负担。智能数据分析功能则基于用户对话历史，智能挖掘用户问题和需求，提供个性化解决方案，以提升用户满意度和忠诚度。

昆仑万维发布实时语音对话助手 Skyo

时间：11月20日
介绍：
https://mp.weixin.qq.com/s/k41z102T5JAfIJHeLLJP2w

昆仑万维推出了一款名为 Skyo 的实时语音对话助手，该产品基于天工大模型4.0 4o版（Skywork 4o）构建。Skyo 的命名中的“o”代表omni，意味着其全能的特性，直接与GPT-4o对标。Skyo作为一个智能语音互动产品，具备快速响应、实时打断、情感化反应、真实内容互动和个性化声音定制等多项功能，旨在为用户提供一个全面且个性化的语音交互体验。

Skyo 不仅能够理解用户的情绪并提供情感化的回应，还能在对话中追踪并回忆用户的偏好和历史信息，以提升多次对话的准确度。此外，Skyo还支持多语言和主动交流，能够为用户提供持续的陪伴和个性化的服务。Skyo 预计将于12月份上线昆仑万维旗下的天工APP，进一步丰富天工平台的功能，让用户能够体验到AI原生实时对话的乐趣。

搜狗发布基于腾讯混元大模型输入法 12.0

时间：11月21日
介绍：
https://mp.weixin.qq.com/s/2YXcHfZP7YOsgCcJ5r_uZQ

搜狗输入法12.0版本正式发布，此次升级深度融合了腾讯混元大模型的技术，带来了多项智能功能的提升。新版本引入了“边输边查”的AI搜索能力，使得用户在移动端和PC端都能享受到更快捷的搜索体验。此外，新版本的搜狗输入法还包含了AI快查功能，允许用户在聊天过程中快速查询天气、股价、假期等信息，而无需中断对话。

搜狗输入法12.0版本还引入了AI陪伴功能，通过桌面宠物为用户提供情感互动，以及魔术手势操作，使得键盘输入更加流畅和便捷。同时，新版本在视觉和交互设计上也进行了升级，提供了更轻盈、简洁的用户界面和多达22种的键盘布局选择，以满足不同用户的个性化需求。

阿里国际发布面向开放型问题的推理模型 Marco-o1

时间：11月22日
介绍：
https://mp.weixin.qq.com/s/qGE6hpzcsRTLxB5u3_RNew

阿里国际AI团队发布了一款名为 Marco-o1 的新型推理模型，该模型特别关注于解决开放性问题，即那些没有标准答案或明确奖励的问题。Marco-o1 模型通过使用超长CoT（Chain of Thought）数据进行微调，并结合MCTS（蒙特卡洛树搜索）扩展解空间，以增强模型在推理和开放式问题解决方面的能力。此外，该模型还创新地应用于翻译任务中，显示出对长难句翻译的良好效果。

Marco-o1 模型的设计不仅强化了对标准学科问题的处理能力，还特别强调了对那些难以量化和缺乏明确奖励的问题的解决能力，这使得模型在多个领域都有潜在的应用价值。阿里国际AI团队的目标是验证这类模型能否有效地推广到更广泛的领域，从而推动AI技术在更多实际问题中的应用。

商汤绝影首发智能座舱大模型产品 "A New Member For U"

时间：11月27日
介绍：
https://mp.weixin.qq.com/s/iCpJ6oUcNi6gDdt-DHTitQ

商汤绝影在「绝影实力AI DAY」上首次推出了名为「A New Member For U」（你的家庭新成员）的智能座舱大模型产品，旨在为汽车赋予更丰富的智能特性和「有趣的灵魂」。这款创新产品标志着商汤绝影在智能汽车领域的深入布局，通过构建「车云一体」的产品矩阵，覆盖了高速、城区以及泊车等全场景的高阶智能驾驶需求。

同时，商汤绝影还全新升级了行业标杆级别的「开悟」世界模型，进一步强化了其在智能驾驶领域的数据基础设施。通过与车企伙伴的全方位深度合作，商汤绝影致力于共享大算力与大模型，共建数据基础设施，共同打造智能汽车大模型创新应用，以领航未来智能汽车的发展。

昆仑万维推出中文推理「天工大模型 4.0」Skywork o1

时间：11月27日
介绍：
https://mp.weixin.qq.com/s/GEexCGB6-tN_mWNcawSidA

昆仑万维推出了国内首款具备中文逻辑推理能力的大模型——「天工大模型4.0」o1版（Skywork o1）。这一模型系列不仅内生了思考、计划和反思等能力，而且在标准评测集上的推理能力相较于普通模型有显著提升，真正实现了模型的思考和反思带来的推理能力增强。

Skywork o1 系列包括三款模型：Skywork o1 Open、Skywork o1 Lite和Skywork o1 Preview，分别针对不同的应用场景和需求，该模型在逻辑推理、自我反思和验证等方面的表现，使得它在处理复杂问题时更加游刃有余。Skywork o1 的推理能力得益于昆仑万维自研的三阶段训练方案，包括推理反思能力训练、推理能力强化学习以及推理planning，这些技术的应用使得Skywork o1在多项推理任务中达到了业界领先水平。

阿里通义团队发布实验性 AI 推理模型 QwQ

时间：11月28日
介绍：
https://qwenlm.github.io/zh/blog/qwq-32b-preview/

阿里通义团队推出了一款名为 QwQ 的实验性AI推理模型，该模型由Qwen团队开发，专注于提升人工智能的推理能力。QwQ 模型通过模拟人类深度思考、质疑和反思的过程，使得AI在解决复杂问题，尤其是在数学和编程领域上取得了突破性进展。这一模型的发布标志着阿里在AI推理技术研究方面迈出了重要的一步。

QwQ 模型虽然展现出了在特定领域的卓越能力，但仍存在一些局限性，包括语言切换问题、推理循环、安全性考虑以及在非数学和编程领域能力的差异。尽管如此，QwQ 模型的推出为AI推理技术的发展提供了新的方向，并展示了通义团队在AI领域的深入探索和持续创新。

快手发布最新 Code Embedding 模型「绿洲」OASIS

时间：11月28日
介绍：
https://mp.weixin.qq.com/s/LC-47Kehj3gD1_sqrxBUQg

快手Kwaipilot团队宣布开源名为“绿洲”（OASIS）的Code Embedding模型，这是一个在代码表征领域取得突破性进展的技术成果。OASIS 模型仅使用5M Tokens数据，便在多个代码搜索基准测试中显著超越了现有的最佳水平，包括OpenAI的模型。这一成就展示了OASIS在代码检索和理解方面的高效性能，以及在资源使用上的极大优势。

OASIS 模型通过结合程序分析技术和创新设计的损失函数，在极低的成本下实现了优异的性能。它采用了仓库级程序分析技术，通过分析函数调用关系和依赖结构，更好地理解代码在更大上下文中的语义。此外，OASIS还引入了数据增强策略和融合式损失函数，进一步提升了模型在区分相似样本和识别细微语义差异方面的能力。

AI新势力

xAI 开启 Grok API 公测

时间：11月4日
介绍：
https://x.ai/blog/api

xAI 宣布开启 Grok API 的公测，开发者可以基于Grok基础模型构建应用程序。公测期间，xAI提供了每月25美元的免费API额度，直至2024年底。此次公测首先推出的是名为grok-beta的新Grok模型，该模型在性能上与Grok 2相当，但在效率、速度和功能上都有所提升，目前已接近完成并正在进行最后的完善。

除了文本版本的grok-beta模型，xAI还计划很快推出一个多模态版本，这个新版本将能够直接处理图片，进一步扩展Grok模型的应用范围。这一更新展示了xAI在提升AI模型性能和功能方面的持续进步，同时也为开发者提供了更多样化的工具来构建和优化他们的应用程序。

零一万物发布基于 Yi 大模型 ToB 解决方案

时间：11月6日
介绍：
https://mp.weixin.qq.com/s/so6DDe4F7DFoQKFs8BOOGg

零一万物科技有限公司宣布了基于其Yi系列大模型的全面ToB解决方案。这些解决方案涵盖了模型训练、零售行业应用，以及智算中心构建等多个方面，体现了零一万物“Infra+模型+应用”的三体布局战略。这些解决方案包括全链路模型运维平台、数字人解决方案“如意”、营销短视频解决方案“万视”，以及助力政企构建大模型算力平台的AI Infra解决方案。

零一万物的ToB战略已经与多家世界500强企业展开合作，覆盖能源、零售、游戏、电商等多个领域。公司创始人及CEO李开复博士强调，AI 2.0将重塑行业生产力格局，而零一万物将继续坚持其三位一体布局，探索AI ToB的最佳实践，以垂直整合的商业模式为客户提供降本增效的解决方案。

智谱AI重磅升级「清影」并开源 CogVideoX v1.5

时间：11月8日
介绍：
https://mp.weixin.qq.com/s/5-6RIkFHfgstWydTp4jRoQ

智谱AI的“清影”迎来了重大升级，此次更新包括支持10秒时长、4K分辨率、60帧超高清画质的视频生成，以及任意尺寸的视频生成能力。此外，新版本还增强了人体动作和物理世界的模拟，并首次引入了自带音效的功能，使得生成的视频更加生动和真实。

同时，为了支持开发者社区，智谱AI宣布开源 CogVideoX v1.5-5B 和 CogVideoX v1.5-5B-I2V 模型。这些模型在数据筛选、模型结构、视频理解、transformer架构和训练框架等多个方面进行了创新，验证了scaling law在视频生成方面的有效性。

生数科技发布全球首个支持多主体一致性的多模态大模型 Vidu-1.5

时间：11月13日
介绍：
https://mp.weixin.qq.com/s/7BWLPmfC1Hl3wfZJJ0V4iw

生数科技发布了全球首个支持多主体一致性的多模态大模型 Vidu-1.5，它不仅能够理解多样化的输入，还成功突破了“一致性”难题，允许在视频生成中保持人物、物体和环境等主体的一致性。这一技术的进步使得Vidu-1.5在复杂主体的精准控制、人物面部特征和动态表情的自然一致性以及多主体交互方面表现出色，为用户带来了更加丰富和真实的视频生成体验。

Vidu-1.5 的推出让视觉模型进入了全新的“上下文”时代，这一时代的特点是模型能够展现出对上下文的深刻理解和记忆能力，类似于语言模型在经过充分训练后所表现出的智能涌现特征。这种能力的提升不仅加速了向通用人工智能（AGI）的发展，也为视觉模型在认知能力上的增强提供了可能，使其成为实现更全面智能的关键组成部分。

月之暗面发布新一代数学推理模型 k0-math

时间：11月17日
介绍：
https://mp.weixin.qq.com/s/g4DltigncX-4sfaQ6Qn1zA

月之暗面宣布了其在强化学习技术上的最新进展，主要为新一代数学推理模型 k0-math。k0-math 模型在能力上趋近于OpenAI的o1系列，它采用了全新的强化学习和思维链推理技术，通过模拟人脑的思考和反思过程，显著提升了解决数学难题的能力。这款模型在多项数学基准能力测试中的表现对标OpenAI o1系列的可公开使用的模型，展现出在中考、高考、考研以及包含入门竞赛题的MATH等数学基准测试中的卓越成绩。

k0-math 模型在解题过程中会花费更多时间进行推理，包括思考和规划思路，并在必要时自行反思改进解题思路，以提高答题成功率。尽管k0-math在解决具有挑战性的数学任务方面表现出色，但它在处理LaTeX格式难以描述的几何图形类问题以及过于简单的数学问题时还存在局限性，这些局限预计将在后续的模型迭代中得到改善。

Mistral 开源1240亿参数超大多模态模型 Pixtral Large

时间：11月18日
介绍：
https://mistral.ai/news/pixtral-large/

Mistral AI 开源了名为 Pixtral Large 的1240亿参数超大多模态模型，这是一个具有前沿级图像理解能力的模型，能够支持128K的上下文窗口，理解文本、图表和图像。Pixtral Large 基于Mistral Large 2构建，包含1230亿参数的多模态解码器和10亿参数的视觉编码器，使其在多个基准测试中超越了包括GPT-4o、Gemini-1.5Pro、Claude-3.5Sonnet和Llama-3.290B在内的其他模型，成为目前最强的开源多模态模型。

Pixtral Large 的主要功能包括图像描述、视觉问答、文档理解以及多语言支持，它能够处理复杂的场景和长篇文档。技术原理方面，模型采用了多模态解码器、视觉编码器、变换器架构、自注意力机制、序列打包技术和长上下文窗口，这些技术的综合应用使得Pixtral Large在教育、学术研究、客户服务、内容审核、医疗影像分析和安全监控等多个领域都有广泛的应用潜力。

DeepSeek 上线推理模型 DeepSeek-R1-Lite 预览版

时间：11月20日
介绍：
https://mp.weixin.qq.com/s/e1YnTxZlzFvjcmrLLTA8fw
官网：
https://chat.deepseek.com/

DeepSeek 推出了其推理模型 DeepSeek-R1-Lite 的预览版，该模型经过强化学习训练，具备在数学、代码和复杂逻辑推理任务上的强大推理能力。与o1-preview模型相媲美，DeepSeek-R1-Lite 能够展现出o1模型未曾公开的完整思考过程，其推理过程包含大量反思和验证，思维链长度可达数万字，为用户提供了深入的推理对话体验。

DeepSeek-R1-Lite 预览版在美国数学竞赛（AMC）中难度等级最高的AIME以及全球顶级编程竞赛（codeforces）等权威评测中取得了卓越成绩，大幅超越了GPT-4o等知名模型。模型的推理过程长且包含了大量的反思和验证，这使得其在数学竞赛上的得分与测试所允许的推理长度呈正相关，展现出模型思维链长度增加的高效率。

上海人工智能实验室开放强推理模型「书生InternThinker」试用

时间：11月25日
介绍：
https://mp.weixin.qq.com/s/AbL3KewLXtvweEk9seOTAw

上海人工智能实验室展示了其最新研发成果——强推理模型书生InternThinker，并开放了试用体验。InternThinker 模型在自主生成高智力密度数据和具备元动作思考能力方面取得了显著进展。该模型不仅具备长思维能力，还能在推理过程中进行自我反思和纠正，这些特性使其在处理数学、代码和推理谜题等多种复杂任务时能够取得更优的结果。

InternThinker 模型的设计灵感来源于人类解决复杂问题时的思维模式，通过模拟人类学习过程中的元认知能力，InternThinker能够更有效地学习和解决复杂任务。该模型的推出，是上海AI实验室在探索开放、可控、可信的通用人工智能（AGI）道路上的重要一步。

Anthropic 宣布开源 MCP（模型上下文协议）

时间：11月25日
介绍：
https://www.anthropic.com/news/model-context-protocolMCP
官网：
https://modelcontextprotocol.io/

Anthropic 宣布开源了一个名为模型上下文协议（Model Context Protocol，简称MCP）的革命性新协议，旨在简化大型语言模型（LLM）应用与外部数据源和工具之间的无缝集成。MCP 协议为开发者提供了一种标准化的方法，使得构建AI驱动的开发环境、增强聊天界面或创建自定义AI工作流变得更加容易，不再需要为每个数据源编写定制的集成代码。

MCP 的核心价值在于其能够使前沿模型生成更优质、更相关的响应。通过这一协议，开发者可以更容易地将LLMs与所需的上下文连接起来，从而提高模型的响应质量和相关性。MCP的开源性质意味着它将促进一个由开发者组成的不断增长的社区，共同构建和优化这一协议，以满足不断变化的技术需求和应用场景。

理想汽车正式全量推送新一代智驾车位到车位功能

时间：11月28日
介绍：
https://mp.weixin.qq.com/s/pE8W0RNMbyRsezp8qZDBNQ

理想汽车宣布了其最新领先行业的技术突破，正式全量推送其新一代智能驾驶技术架构——端到端+VLM双系统的车位到车位功能。这一功能的推出标志着理想汽车成为全球首家实现全量推送车位到车位智能驾驶的车企，展现了其在智能驾驶领域的领先地位。

理想汽车的新一代智能驾驶技术架构通过结合端到端的快速响应和VLM（视觉解决方案）的深度理解能力，能够更加精准地处理复杂的交通环境，提供从停车位到停车位的全程智能驾驶体验。这项技术不仅提高了智能驾驶的效率和安全性，也为用户提供了更加便捷和舒适的驾驶体验。

会议&活动

小鹏AI科技日

时间：11月6日
介绍：
https://www.xiaopeng.com/news/company_news/5409.html
一图总结：
https://mp.weixin.qq.com/s/xP-ce9ujYzc1KmpORGXuEg

2024年11月6日，小鹏汽车在广州华南理工大学举办了以“科技改变世界”为主题的小鹏AI科技日活动。小鹏汽车董事长兼CEO何小鹏在活动中重返母校，并以全球直播的形式向全球用户和科技爱好者展示了小鹏汽车在AI领域的最新成果。

活动重点介绍了小鹏汽车的AI体系，涵盖AI汽车、AI机器人和飞行汽车三大板块的创新技术和成果。小鹏汽车首次披露了小鹏鲲鹏超级电动体系和小鹏图灵AI智驾体系，小鹏鲲鹏超级电动体系基于全域800V高压碳化硅平台，包括5C超充AI电池、混合碳化硅同轴电驱、静音增程器等技术，旨在提供更长的续航能力和更快的充电体验。而小鹏图灵AI智驾体系则以AI大模型为核心，包括自研的云端和车端大模型、AI芯片和底层架构，致力于提升智能驾驶的性能和用户体验。这些技术的发布标志着小鹏汽车在智能电动出行领域的深入布局和持续创新。

Baidu World 2024

时间：11月12日
介绍：
https://baiduworld.baidu.com/

Baidu World 2024 是百度于11月12日举办的年度盛会，已连续举办18年，是百度发布年度战略、技术和产品的重要平台，也是行业交流前沿技术、碰撞创新思维、洞察未来趋势的关键场合。此次大会，百度CEO李彦宏发表了题为“应用来了”的主旨演讲，分享了百度在大模型应用上的观察和思考，并展示了百度过去一年在大模型方面的成绩单。主要内容和观点包括：

AI行业的最大变化是大模型基本消除了幻觉，并发布了检索增强的文生图技术iRAG，强调其无幻觉、超真实、没成本和立等可取的商业价值。
AI是真需求，应用方向分为智能体和产业应用，其中智能体将成为AI应用的最主流形态，并可能成为AI原生时代内容、信息和服务的新载体。
李彦宏还表示，百度不是要推出一个“超级应用”，而是要打造数百万个“超级有用”的应用，并发布了无代码工具“秒哒”，称之为“迄今为止人类历史上最复杂的多智能体协作工具”。

整体而言，Baidu World 2024 不仅展示了百度在AI领域的最新成果，也传递了百度对未来AI发展趋势的洞察和展望，为行业提供了宝贵的思考和启示。

2024世界互联网大会乌镇峰会

时间：11月19~11月22日
峰会官网：
https://cn.wicinternet.org/node_160487.htm
一图速览：
https://mp.weixin.qq.com/s/89GlNzzel1is4L6j9i6Rjg

2024世界互联网大会乌镇峰会于11月19日至22日成功举办，作为互联网行业的重要盛会，峰会汇聚了全球互联网领域的精英和专家，共同探讨互联网技术的最新进展和未来趋势。会议期间，与会者围绕互联网新技术、新业态、新模式等话题展开深入交流，分享创新成果和实践经验，为推动全球互联网发展贡献了智慧和力量。

此次峰会的亮点是聚焦互联网技术尤其是人工智能的创新和应用。与会嘉宾纷纷展示了各自在互联网技术领域的最新成果，探讨了人工智能、大数据、云计算等前沿技术在各行业的应用前景。同时，峰会还设置了多个分论坛和研讨活动，就互联网治理、数字经济、网络安全等热点话题进行深入探讨，为推动构建网络空间命运共同体提供了重要思路和建议。

知识星球，新人优惠券来袭，结识一群志同道合的小伙伴一起成长。

下一个风口会不会是生成式AI 与具身智能的时代，我们特意创建了生成式AI与具身智能交流社区，关于大模型，机器人的相关业界动态，学术方向，技术解读等等都会在社区与大家交流，欢迎感兴趣的同学加入我们(备注具身智能)！

自动驾驶之星知识星球主打自动驾驶量产全技术栈学习，并包括: 学习板块，求职面试，有问必答，论文速递，行业动态五大板块！星球内部包括端到端大模型，VLM大模型，BEV 障碍物/车道线/Occ 等的学习资料！

生成式AI与具身智能知识星球，我们相信生成式AI 与具身智能会碰撞出出乎我们意料的内容，本知识形象并包括: 学习板块，求职面试，有问必答，论文速递，行业动态五大板块！星球内部包括生成式AI大模型，具身智能，业界资料整理等的学习资料！

自动驾驶之星是面向自动驾驶&智能座舱量产向相关的交流社区，欢迎大家添加小助手加入我们的交流群里，这里有一批奋斗在量产第一线的小伙伴等你的加入！

👇点个“赞”和“在看”吧

\ \ \ END / / /

↓↓↓ 点击进入 “大模型月报” 专题汇总 ↓↓↓

自动驾驶之星

自动驾驶之星，是一个以自动驾驶\x26amp;智能座舱量产交流为主的社区。这里有自动驾驶\x26amp;智能座舱量产第一线的前沿动态，有一群奋斗在自动驾驶\x26amp;智能座舱量产第一线的小伙伴在分享他们的量产经历。期待你的加入！希望每个人在这个浪潮中都能成为自动驾驶之星！