DeepSeek-V3 正式发布

科技 2024-12-27 12:10 广东

今天，我们全新系列模型 DeepSeek-V3 首个版本上线并同步开源。

登录官网 chat.deepseek.com 即可与最新版 V3 模型对话。API 服务已同步更新，接口配置无需改动。当前版本的 DeepSeek-V3 暂不支持多模态输入输出。

性能对齐海外领军闭源模型

DeepSeek-V3 为自研 MoE 模型，671B 参数，激活 37B，在 14.8T token 上进行了预训练。

论文链接：

https://github.com/deepseek-ai/DeepSeek-V3/blob/main/DeepSeek_V3.pdf

DeepSeek-V3 多项评测成绩超越了 Qwen2.5-72B 和 Llama-3.1-405B 等其他开源模型，并在性能上和世界顶尖的闭源模型 GPT-4o 以及 Claude-3.5-Sonnet 不分伯仲。

百科知识：DeepSeek-V3 在知识类任务（MMLU, MMLU-Pro, GPQA, SimpleQA）上的水平相比前代 DeepSeek-V2.5 显著提升，接近当前表现最好的模型 Claude-3.5-Sonnet-1022。
长文本：长文本测评方面，在DROP、FRAMES 和 LongBench v2 上，DeepSeek-V3 平均表现超越其他模型。
代码：DeepSeek-V3 在算法类代码场景（Codeforces），远远领先于市面上已有的全部非 o1 类模型，并在工程类代码场景（SWE-Bench Verified）逼近 Claude-3.5-Sonnet-1022。
数学：在美国数学竞赛（AIME 2024, MATH）和全国高中数学联赛（CNMO 2024）上，DeepSeek-V3 大幅超过了所有开源闭源模型。
中文能力：DeepSeek-V3 与 Qwen2.5-72B 在教育类测评 C-Eval 和代词消歧等评测集上表现相近，但在事实知识 C-SimpleQA 上更为领先。

生成速度提升至 3 倍

通过算法和工程上的创新，DeepSeek-V3 的生成吐字速度从 20 TPS 大幅提高至 60 TPS，相比 V2.5 模型实现了 3 倍的提升，为用户带来更加迅速流畅的使用体验。

API 服务价格调整

随着性能更强、速度更快的 DeepSeek-V3 更新上线，我们的模型 API 服务定价也将调整为每百万输入 tokens 0.5 元（缓存命中）/ 2 元（缓存未命中），每百万输出 tokens 8 元，以期能够持续地为大家提供更好的模型服务。

与此同时，我们决定为全新模型设置长达 45 天的优惠价格体验期：即日起至 2025 年 2 月 8 日，DeepSeek-V3 的 API 服务价格仍然会是大家熟悉的每百万输入 tokens 0.1 元（缓存命中）/ 1 元（缓存未命中），每百万输出 tokens 2 元，已经注册的老用户和在此期间内注册的新用户均可享受以上优惠价格。

开源权重和本地部署

DeepSeek-V3 采用 FP8 训练，并开源了原生 FP8 权重。

得益于开源社区的支持，SGLang 和 LMDeploy 第一时间支持了 V3 模型的原生 FP8 推理，同时 TensorRT-LLM 和 MindIE 则实现了 BF16 推理。此外，为方便社区适配和拓展应用场景，我们提供了从 FP8 到 BF16 的转换脚本。

模型权重下载和更多本地部署信息请参考：

https://huggingface.co/deepseek-ai/DeepSeek-V3-Base

“以开源精神和长期主义追求普惠 AGI”是 DeepSeek 一直以来的坚定信念。我们非常兴奋能与社区分享在模型预训练方面的阶段性进展，也十分欣喜地看到开源模型和闭源模型的能力差距正在进一步缩小。

这是一个全新的开始，未来我们会在 DeepSeek-V3 基座模型上继续打造深度思考、多模态等更加丰富的功能，并将持续与社区分享我们最新的探索成果。

—— End ——

OSC开源社区

开源中国，只关注开源圈、技术圈的硬核内容，与嬉笑怒骂。

LFOSSA感谢信：2024年回顾与2025年展望

微软CEO Nadella 预言：软件行业将发生天翻地覆的变化！

开源日报|树莓派5将推出16GB内存版本；爱奇艺起诉Minimax索赔10万元；为啥最强开源CPU是中国的；Cursor开源替代

罗永浩AI创业项目J1 Assistant首次亮相：智能助理软件、UI“梦回”锤子手机，“闪念胶囊”的AI版本？

在研究了400家公司后，我发现了AI创业的真相

Deepseek团队核心成员揭秘——清北应届生撑起一片天

Nodejs的竞争者Bun又整活了，Bun.s3预告

夜莺开源监控突破一万 star，当我们离开的时候希望世人还记得我们

苹果Safari浏览器上的一个怪象——更白的白色

开源日报|Top 15中国互联网公司全部盈利；百度网页版新增“AI搜”；AI公司爬虫无视robots.txt协议；年度数据库回顾

用Rust重写近6万行C++代码是怎样的体验？

Star超9k，开箱即用，企业LLM应用开发平台BISHENG直播来咯

2024年度数据库回顾

开源日报|Qwen-VL大模型全面降价；华为轮值董事长孟晚舟新年致辞；技术债务就像是幸存者的战斗伤痕；国产AI舞台站满90后天才

2024年系统编程语言调查报告：Rust稳居榜首、Zig紧随其后

「AI 为伍重启征程」2024 OSC 源创会年终盛典在珠海圆满落幕

中国AI的进步之快，让美国人开始怀疑现实了

开源日报|用Rust重写C++代码的总结；解读Deepseek V3；AI Agent现状与未来；AI芯片新战役；编程十年的感悟

最强开源终端模拟器Ghostty正式发布1.0：原生UI体验、采用Zig编写、速度飞快、支持Mac和Linux、支持GPU加速

蚂蚁集团泰初：基于Ray构建统一AI技术栈更有优势

谈谈DeepSeek-v3提到的基础设施演进

2024年AI盘点：投资高歌猛进、基础设施重构、技术采用加速

编程十年的感悟

开源日报|DeepSeek-V3发布；微软与OpenAI发生争执；ChatGPT本月第二次大规模宕机；Ruby 3.4发布

这款“锈化”的开源JS打包工具发布1.0 Beta——性能强劲、尤雨溪主导

开源中国新版APP公测，邀请万名老用户有奖体验

DeepSeek-V3 正式发布

开源日报|小米正在搭建GPU万卡集群；2024全球AI盘点；张一鸣“撞上”雷军；微软变脸OpenAI；苹果为何一直拒用英伟达？

在读计算机女博士退学转战OnlyFans——狂赚百万美金、还清贷款

CodeFuse：让研发变得更简单

地平线/智源/字节/凌川科技齐聚上海，共探编译器优化新进展

突发！GitLab（国际版）将停止对中国区用户提供GitLab.com账号服务

开源日报|AI眼镜明年会火；计算机女博士转战OnlyFans；编程十年感悟；苹果回应不自建搜索引擎；美国对中国芯片发起301调查

本周六，源创会老友们，珠海见！

前端年度大事件盘点：尤雨溪成立公司、ECMAScript 2024发布，以及各大框架重磅更新……

这么多年排序白学了，原来每次排序都在使用世界上最快的排序算法 TimSort

开源日报|2024系统编程语言调查报告；M4 MBA明年发布；IBM为开源项目提供永久免费服务器；智能代理RAG与传统RAG区别

程序员身边都有这样的队友

小猪骑大象：PG内核与扩展包管理神器

开源日报|华硕电脑圣诞节彩蛋“翻车”；只有GPT 3.5称得上突破；curl放弃支持Hyper；OpenAI发布推理模型o3

华硕电脑的圣诞节彩蛋整了个烂活——不仅看上去像感染病毒、还导致内存泄漏

中国基础软件和世界优秀软件的差距在哪？

MySQL 8.0/8.4执行DDL会丢数据？是，但影响有限

GitHub Star数量两天破万——Home Assistant的米家官方集成有什么优势？

AI原生开发平台MoonBit（月兔）开源核心编译器

开源日报|全新桌面版ChatGPT；图森未来退市转型；国产前端开源项目被投毒；LLM供应商Top10；淘宝搜索正在“杀死”淘宝

两款知名国产前端开源项目被“投毒”

Gitee AI携手无问芯穹：模型+算力，共创本土化AI社区新篇章

“2024全球十大工程成就”公布：文生视频大模型Sora、嫦娥六号、无人驾驶汽车等入选

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉