最近
DeepSeek太火了!
一直在微博热搜沸腾
DeepSeek是什么?
DeepSeek:(豆包回答)
最近各大新闻都在说的国产软件DeepSeek是由杭州深度求索人工智能基础技术研究有限公司开发的AI大模型。相关介绍如下:
公司背景
由知名量化资管巨头幻方量化创立,拥有强大的硬件支持,在AI研发领域具备深厚的技术积累和资源优势。
模型亮点
性能卓越:2024年12月发布的DeepSeek-V3模型突破了多个开源大模型的性能,超越了阿里自研的Qwen2.5-72B和Meta的Llama 3.1-405B等模型,并能与OpenAI的GPT-4o、Anthropic 的Claude3.5-Sonnet等闭源大模型相抗衡。2025年1月20日发布并开源的DeepSeek-R1模型在数学、编程和自然语言推理等领域表现出色,甚至与OpenAI的O1模型相匹敌。
训练成本低:据 DeepSeek 发表的原始报告,以DeepSeek-V3为例,在预训练阶段,每兆个 token 上训练仅需要180K H800GPU小时,完整训练仅需2.788MGPU小时,假设H800 GPU的租赁价格为每GPU小时2美元,总训练成本仅为557.6万美元,远低于行业主流模型。
市场影响
DeepSeek-R1上线后,在苹果App Store的美国地区免费应用程式下载榜单上登顶,超越了ChatGPT等热门应用。英伟达、微软、亚马逊等美国科技巨头也纷纷与DeepSeek展开合作,如英伟达上线搭载DeepSeek -R1的软件服务,微软将DeepSeek-R1纳入Azure AI Foundry,亚马逊宣布DeepSeek-R1可在Amazon Web Services 上使用。
出于好奇
小编也问了DeepSeek几个问题
一起来看DeepSeek怎么说的~~
↓↓↓
DeepSeek眼里的大悟是怎样的?
用DeepSeek模仿《滕王阁序》为大悟写一篇《大悟赋》它会怎么写呢?
(。・ω・。)你觉得DeepSeek
回答得怎么样?
快来评论区一起讨论吧~
来源 |大悟新闻,豆包、DeepSeek
别忘了点
分享、
收藏、
在看、
点赞
哦!