DeepSeek-V3外网刷屏爆火

文摘   2025-01-03 07:39   广东  
元旦前夕,与朋友微信聊天,
这位在欧洲一所大学任职的朋友激动地告诉我说,
一家来自中国的公司Deepseek在全球AI界刷屏,其最新推出的大模型DeepSeek-V3,迅速在AI行业内引发广泛关注和热议,
阿里前副总裁贾扬清、MetaAI科学家田渊栋、英伟达高级研究科学家Jim Fan等多位AI领域的大牛,也对DeepSeek-V3 大加赞赏。
有网友甚至认为,这是“全球最佳开源大模型”,“AI 新时代的璀璨之星”。

DeepSeek 是由中国私募基金“幻方量化”于2023 年创立的人工智慧公司,专注于开发先进的AI 技术。
DeepSeek V3是由深度求索公司于2024年12月26日推出,
它是一款全新发布的自研混合专家(MoE)模型,旨在突破当前大语言模型的性能瓶颈。
目前,DeepSeek V3模型已开源,所有用户可以在线使用,也可以本地部署。
这个DeepSeek到底威武在哪里?媒体报道称:
1、性能非常出色:
DeepSeek-V3的性能已成为目前最强大的开源模型之一,
且在多个主流评测基准上,其表现可媲美GPT-4o和Claude-3.5-Sonnet等领先的闭源模型。
特别在数学和代码生成方面,表现尤为突出。
在其首页上,DeepSeek声称:
“DeepSeek-V3 在推理速度上相较历史模型有了大幅提升。在目前大模型主流榜单中,DeepSeek-V3 在开源模型中位列榜首,与世界上最先进的闭源模型不分伯仲。”

DeepSeek 官方首页截图

2、训练成本相对较低:
最让海外AI界震惊的是,在性能突出的同时,该模型的训练成本大幅降低。 
根据媒体报道:天使投资人Balaji称,DeepSeek新开源模型仅花费了560万美元进行训练,与GPT 4和Claude 3.5 Sonnet相当。
也就是说,只要600万美元就能完成训练,与其他顶级模型相比,性价比极高。
如果属实,成本将降低10倍以上。
3、它是开源的:
全球的开发者都可以免费使用和测试它。
4、用户使用性价比高:
2024年5月,DeepSeek V2的开源模型发布。
这个模型的性价比超级高,每百万个token的推理计算成本只要1块钱。 
根据媒体报道,这个价格,大概是Llama3 70B的1/7,也是GPT-4 Turbo的1/70。 
DeepSeek凭借它的高性价比,在中国大模型市场掀起了第一场价格战。
随着 DeepseekV2发布的消息一出,字节、腾讯、百度、阿里,还有kimi这些AI公司都跟着降价。
DeepSeek也被迅速冠以“AI界拼多多”之称。

https://chat.deepseek.com
用户可以通过以下三种方式使用DeepSeek V3:
1、网页版在线使用对话:
用户只要登录DeepSeek官网chat.deepseek.com即可在线使用。
在使用时,用户可体验联网搜索和推理模式。 
2、API调用:
DeepSeek提供API接口,方便有定制化需求的用户使用。 
3、本地部署:
本地部署的灵活性更高,可完全控制,适用于对性能、安全性、隐私有较高要求的用户。

2024年1月,访问学者期末总结会


教育技术学自留地
新鲜、热辣、接地气的教育科技资讯
 最新文章