首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

国产大模型 DeepSeek-V3 正式发布：代码场景逼近Claude-3.5-Sonnet和GPT-4o

职场 2024-12-27 21:20 河南

今天被这个国产大模型 DeepSeek-V3 刷屏了，这个全新自研的 DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。在所有的开源大模型中位列榜首，与当今最先进的闭源模型 Claude-3.5-Sonnet、GPT-4o 相比也不分伯仲

全新自研 MoE 模型 DeepSeek-V3（671B 参数，激活 37B）正式发布，支持对话功能及 API 服务，无需接口调整。
当前版本不支持多模态输入输出。

性能表现

在多项评测中超越 Qwen2.5-72B 和 Llama-3.1-405B，与 GPT-4o、Claude-3.5-Sonnet 等顶尖闭源模型性能相近。

具体领域表现：

百科知识：在知识任务中显著优于前代，接近最佳表现模型。
长文本：在 DROP、FRAMES 和 LongBench v2 上表现领先。
代码：

算法类代码场景远超现有模型。
工程类代码逼近 Claude-3.5-Sonnet。

数学：

在 美国数学竞赛（AIME 2024, MATH） 和 全国高中数学联赛（CNMO 2024） 中表现大幅领先。

中文能力：

在 C-Eval 等教育类测评中表现优异。
在 C-SimpleQA 测评中超越 Qwen2.5-72B。

生成速度提升

吐字速度由 20 TPS 提升至 60 TPS，为用户提供更流畅的体验。

API 服务价格与优惠

新价格：

每百万输入 tokens 0.5 元（缓存命中） / 2 元（缓存未命中）。
每百万输出 tokens 8 元。

优惠期：

输入 0.1 元（缓存命中） / 1 元（缓存未命中）。
输出 2 元。

至 2025 年 2 月 8 日，价格为：

5. 开源权重与本地部署支持

提供原生 FP8 权重及 FP8 至 BF16 的转换脚本。
工具支持：

SGLang 和 LMDeploy 支持原生 FP8 推理。
TensorRT-LLM 和 MindIE 支持 BF16 推理。

总结

DeepSeek-V3 以领先性能和开源特性吸引关注，同时优化生成速度、调整价格策略，为用户带来高效、灵活的使用体验。

参考

https://huggingface.co/deepseek-ai/DeepSeek-V3-Base
https://www.deepseek.com/

期文章推荐

- 这是底线 -

扫描以下二维码加小编微信，备注 “ai”，一起交流 AI 技术！

洞见AI前沿，分享技术与实践，助力智慧未来

最新文章

清华大学《DeepSeek：从入门到精通.pdf》

王者归来！GitHub Copilot 重磅推出 Agent 模式，剑指 Cursor

DeepSeek 中老年人使用指南，90%的人都不知道的使用技巧，强烈建议收藏！

秘塔AI×DeepSeek R1强强联合：解决 99% 用户的联网搜索问题！

OpenAI 祭出 "深度搜索" 大杀器！没想到DeepSeek的回复够犀利！

深度揭秘！99%人不知道的DeepSeek隐藏用法，用错血亏！

打工人逆袭！DeepSeek隐藏的8个AI神操作，每天偷懒2小时竟被夸效率高

重磅！华为芯片跑通DeepSeek！国产AI大模型最低1元100万Token，还能白嫖！

Cursor 说 o3-mini 所有用户免费使用！

重磅！OpenAI 发布免费推理模型 o3-mini，正面对标 DeepSeek，AI 领域再掀波澜

刚刚！Windsurf 宣布支持 DeepSeek R1 和 V3，成本比 Claude 便宜 4 倍！

DeepSeek 使用技巧，强烈建议收藏！普通人逆袭就靠它了！

知乎上爆火的 DeepSeek 梁文峰深夜回信，R1 模型说大概率 AI 写的！

连环出击！美国刚对 DeepSeek 网络攻击，意大利就要求下架？

爆火！新人小白也能用 DeepSeek 写新年祝福！

马斯克：这是我见过的对 DeepSeek 最透彻的分析！

DeepSeek 深夜发布新模型 Janus-Pro！刚打完 OpenAI，现在又脚踢 Midjourney！

重磅升级！Cursor 0.45：AI 更懂代码、DeepSeek 双模型加持

Cline 发布 3.2：白嫖 Claude 3.5、秒变架构师！

V0 的弟弟 “V2” 来了！

硬刚OpenAI o1，DeepSeek开源R1，自带思维链能力，能够推理和解决复杂问题

直冲 Cursor！字节发布全新 AI IDE Trae，Claude-3.5 无限量免费用！

Windsurf 新版本抢占高地，Cursor 说我又拿了 7 亿融资，谁会赢的未来？

Windsurf 发布Wave 2，Web实时搜索、URL上下文、自动化记忆等一大波新功能来袭！

Qwen Chat 发布全新 Web UI！体验超棒！

Roo Cline 3.0 重磅发布：人手一个架构师时代到来！

Gemini 2.0 Flash + Cline 打造最强 0 元购组合！

Cline 3.1 最新发布：体验感拉升一个新高度！

太火爆！Browser-Use WebUI 已被纳入 browser-use 麾下！

Browser-Use WebUI + DeepSeek V3 把浏览器整成自动化了!

Windsurf：唯一让 Cursor 瑟瑟发抖的最强对手！

一起来聊聊 Cursor、Copilot、Windsurf、V0...

Cline + DeepSeek-V3 对打 Cursor，谁更胜一筹？

我把最近爆火的 DeepSeek-V3 接到了 Cursor！

Cursor Yolo 模式太棒了！

国产大模型 DeepSeek-V3 正式发布：代码场景逼近Claude-3.5-Sonnet和GPT-4o

Cursor发布0.44版本：全面提升Agent能力！

感受下 Cursor Agent 的强大魅力！

尤大亲自转发点赞！Github Copilot Edits 有何魔力？

字节最新开源：让 AI 给你写 UI 自动化测试

Cursor 的最佳搭档来了，专治不会写提示词！

Sora 正式发布：刚推出就火的让奥特曼关闭注册功能了！

antd 对 ai 下手了！Vue 开发者表示羡慕！

v0 急了！迎来重大更新，这是要对标 Bolt.new 和 Cursor？

斯坦福大学教授开源新项目：一个接口调用 OpenAI 等众多大模型

那个被何同学抄袭的项目 ASCII-generator 是干嘛用的？

40.9K Star！单图秒变主角，AI实时换脸神器引爆创意新潮流

OpenAI 写给学生的《12 条 ChatGPT 使用指南》

苹果上的 ChatGPT 现已支持 VS Code、Xcode、Terminal 等应用

只需 2 分钟，让 Bolt.new 写一个 “抖音”！

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉