英伟达大动作!爆宣布使用DeepSeek

文摘   2025-01-31 17:23   江苏  

汇集半导体行业资讯 技术前沿、发展趋势!


北京时间2025年1月31日,英伟达公司宣布,其网站上已正式上线采用DeepSeek R1 671b技术的“英伟达NIM微服务”预览版。英伟达公开宣称,DeepSeek-R1的推理能力已达到“最先进”水平。

一、技术突破与新品问世

此次英伟达推出的NIM微服务,是基于HGX H200系统的高效解决方案,每秒能处理高达3872个tokens,这一性能的提升得益于硬件与软件的深度优化。其API设计灵活且易于使用,基于云原生架构,极大地降低了AI应用的部署门槛。预览版的发布旨在吸引开发者进行测试并提供反馈,未来该服务将全面融入英伟达的AI Enterprise平台。

二、行业布局与战略意义

英伟达此举被视为在企业级AI市场的重要布局,旨在通过提供高性能的AI微服务解决方案,加速高性能模型的商业化进程。这一创新产品或将重塑AI供应链的格局,为开发者提供更强大的工具,降低开发成本,并在多个行业中展现出广泛的应用潜力。同时,这也将推动边缘端AI应用的发展,并引领MaaS(模型即服务)商业模式的兴起。英伟达旨在通过完善NIM生态,进一步巩固其在AI基础设施领域的领导地位,以应对来自云厂商的竞争。

三、DeepSeek-R1模型亮点

DeepSeek-R1是一款拥有6710亿参数的大型MoE(混合专家)模型,支持高达128000个Token的输入。该模型通过多次推理和思路链生成答案,对计算性能提出了极高的要求,需要高性能GPU的支持。英伟达表示,下一代架构将进一步提升DeepSeek-R1的推理能力。

四、开源推动与业界反响

值得一提的是,加州大学伯克利分校已开发出低成本且开源的TinyZero项目,这将有助于推动DeepSeek技术的普及和应用。同时,微软已将DeepSeek R1模型加入其Azure和GitHub平台,进一步扩大了DeepSeek的影响力。

五、数据中心市场展望

在数据中心投资方面,黑石集团对数据中心市场持乐观态度,这反映了数据中心市场的稳健需求。与英伟达等合作伙伴的紧密合作,将共同推动AI行业的快速发展。

六、DeepSeek创始人荣归故里

此外,DeepSeek的创始人梁文锋在春节期间荣归故里广东省湛江市吴川市,受到了家乡人的热烈欢迎。横幅、拱门等庆祝方式彰显了他的成就对家乡的鼓舞。

梁文锋成长于一个普通家庭,父母均为小学老师。他自幼成绩优异,尤其擅长数学,初中时已学完高中及部分大学数学课程。他的事迹被广泛传播,成为家乡的骄傲。他在除夕回乡,大年初一离开,这一短暂的回乡之旅也引起了广泛的关注和热议。


 *声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,侵权欢迎联系我们删除!


往期推荐

半导体门户
半导体行业资讯、半导体商机、半导体招商、半导体企业及产品。
 最新文章