首页
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
更多
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
Deepseek,星火已燎原!
文摘
2025-02-05 21:09
上海
DeepSeek系列模型上线华为昇腾社区,华为小艺助手App的智能体广场已上线DeepSeek-R1的Beta版。随着DeepSeek朋友圈的扩大,有望进一步推动大模型的低成本化,扩大AI的垂直应用场景。
作者 | 黄心怡
随着DeepSeek热度飙升,其“朋友圈”也在快速扩容。
今日,京东云宣布正式上线DeepSeek-R1和DeepSeek-V3模型,支持公有云在线部署、专混私有化实例部署两种模式。前几日,阿里云、百度智能云、华为云、腾讯云、火山引擎、天翼云已接入了DeepSeek模型。海外的亚马逊AWS、微软Azure等云巨头同样官宣支持。
多家国产芯片厂商亦纷纷响应。华为今天宣布DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro上线昇腾社区;DeepSeek-V3满血版在国产沐曦GPU首发体验上线。天数智芯、摩尔线程、海光信息也在2月4日宣布支持DeepSeek模型。而英伟达、AMD、英特尔等海外芯片巨头在更早已完成支持。
此外,无问芯穹、硅基流动等AI基础设施厂商,以及青云科技、PPIO派欧云、云轴科技等独立云厂商,已宣布适配及上架模型服务。
从底层芯片到云服务商,随着DeepSeek朋友圈的扩大,有望进一步推动大模型的低成本化,扩大AI的垂直应用场景。
目前,华为小艺助手App的智能体广场已上线DeepSeek-R1的Beta版。科创板上市公司光云科技、当虹软件等也接入DeepSeek系列模型开展应用探索。
▌
六大云巨头上线DeepSeek系列模型 推动开源生态发展
DeepSeek旗下大模型“爆火”后,国内主流云平台均陆续上线了相关模型。
今日,京东云言犀AI开发计算平台宣布支持DeepSeek-V3、DeepSeek-R1以及所有蒸馏小参数模型(DeepSeek-R1-Distill)的一键部署。
春节期间,华为云和硅基流动联合首发并上线了基于华为云昇腾云服务的DeepSeek-R1/V3推理服务。阿里、腾讯、百度、火山引擎等云厂商也上线了DeepSeek系列模型。其中,百度智能云还提出了限时免费的服务方案。至此,国内六大云巨头都已正式支持DeepSeek。
中国云平台集中上线DeepSeek,其背后是云厂商们希望在DeepSeek的火爆浪潮中,吸引更多客户使用其算力和服务。
AI产品榜的数据显示,DeepSeek仅上线18天时日活就突破1500万,而ChatGPT过1500万花了244天,增速是ChatGPT的13倍。上线20天后,DeepSeek日活已达2215万,是ChatGTP日活用户的41.6%,超过豆包的日活用户1695万。
云基础设施厂商有望受益于DeepSeek带来的新叙事,而DeepSeek的成功,也将提振整个开源社区的共建氛围,使得更多开源模型能够“站在巨人肩膀上”快速进步。
相比OpenAI的闭源路线,DeepSeek选择了开源的开放路线,这类似于PC时代的Windows和Linux之争。面对DeepSeek的爆火,OpenAI首席执行官萨姆·阿尔特曼此前承认称,OpenAI在开源策略上“站在了历史的错误一边”,并表示需要考虑制定不同的开源策略。
华泰证券认为,开源模型的优势体现在社区共建和技术共享。理论上所有的小参数模型均能够直接利用DeepSeek-R1蒸馏出的标签数据,来增强推理性能。
2025年或是开源模型快速进步的一年,国产大模型进展值得关注。
▌
主流国产芯片兼容支持 挑战和机遇并存
在芯片领域,DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区,支持一键获取DeepSeek系列模型,支持昇腾硬件平台上开箱即用,同时提供精度性能微调,推理服务化快速部署等能力,
摩尔线程也发文称,已实现对DeepSeek蒸馏模型推理服务的部署。为推进国产AI生态发展,摩尔线程即将开放自主设计的夸娥(KUAE)GPU智算集群,全面支持DeepSeek-V3、R1模型及新一代蒸馏模型的分布式部署。
天数智芯与Gitee AI成功完成了与DeepSeek-R1的适配工作,并且已正式上线多款大模型服务,其中包括DeepSeek-R1-Distill-Qwen-1.5B、DeepSeek-R1-Distill-Qwen-7B、DeepSeek-R1-Distill-Qwen-14B等。天数智芯还称,正在与并行科技、算力互联等多家伙伴,开展DeepSeek包括R1在内的多款模型的适配与上线,后续即将上线的并行科技平台,不仅面向普通用户和开发者,更是主要面向企业用户的AI服务平台。
Gitee AI联合沐曦于2月2日首发全套DeepSeek-R1千问蒸馏模型,实现了从芯片到平台,从算力到模型,全国产研发、中国制造。2月5日,Gitee AI进一步表示,DeepSeek-V3满血版在国产沐曦GPU首发体验上线。
而海光信息也完成了DeepSeek V3和R1模型与海光DCU(深度计算单元)的适配,并正式上线。
此外,国家超算互联网平台已正式上线DeepSeek-R1模型的1.5B、7B、8B、14B版本,并将于近期陆续更新32B、70B等版本。除R1模型外,国家超算互联网平台还上线了DeepSeek-V3、DeepSeek-v2.5系列、DeepSeek-coder系列、DeepSeek-math系列(7b)和DeepSeek-v2系列(Lite)等模型。
“
DeepSeek大模型与国产芯片的适配基本不花时间,而性能优化估计一周完成
。”有算力领域人士介绍。
“当下,主流国产芯片已基本实现对DeepSeek 蒸馏版小模型的兼容支持。这意味着,只要此前能够运行Llama、Qwen这类常见模型,如今便可直接无修改地运行DeepSeek蒸馏版小模型。”魔形智能联合创始人徐凌杰对记者表示,“可以预见,
随着基于 DeepSeek的应用如雨后春笋般爆发,越来越多芯片厂商的入局,新一轮市场竞争与价格调整或许即将拉开帷幕
。”
不过,徐凌杰也指出,满血版的V3和R1拥有6710亿参数,这使得它们对硬件的要求大幅提升。同时,由于采用了此前未被广泛应用的MoE专家并行(EP)策略,其运行需要额外的推理框架支持。
“
目前,仅有少数几家国产芯片成功上线了满血版
。要想完全解锁DeepSeek高性能、低成本的推理优势,
按照官方推荐配置,需在推理的解码部分部署320个GPU,以实现完全的专家并行。这种‘超节点’式的部署方式,对所有国产芯片厂商而言,既是全新的挑战,也是难得的机遇
。”徐凌杰提到。
▌
扩大AI的应用场景
谈及未来DeepSeek对国内AI产业链的利好影响,沐曦联合创始人杨建表示,
最大的影响是强化学习的蒸馏流程开源,让大模型在垂直领域的后训练和推理成本急剧下降,同时在垂直领域的可用性急剧上升,同时催生大模型在各行各业的认知,拉升私有化垂直模型部署的愿望
。R1蒸馏32B模型的能力逼近OpenAI的O1,使得企业可以私有化低成本部署而不用担心泄密问题,部署意愿极大提高。
TrendForce集邦咨询研究指出,DeepSeek模型虽然降低了AI训练成本,
但AI模型的低成本化可望扩大应用场景,进而增加全球数据中心建置量。
光收发模块作为数据中心互连的关键组件,将受惠于高速数据传输的需求。未来AI服务器之间的数据传输,都需要大量的高速光收发模块,这些模块负责将电信号转换为光信号并通过光纤传输,再将接收到的光信号转换回电信号。TrendForce数据显示,2023年400Gbps以上的光收发模块全球出货量为640万个,2024年约2040万个,预估至2025年将超过3190万个,年增长率达56.5%。
“
实际上从22-24年对大模型应用的风险投资在减少,今年可能会逆转。因为后训练成本急剧下降
。”杨建对《科创板日报》表示。
随着DeepSeek带动模型成本的下降,有望推动AI应用的爆发。科创板上市公司光云科技、当虹科技等都在探索DeepSeek模型的落地应用。其中,快麦小智是光云科技旗下智能客服机器人,其基于大模型的智能体产品绫智的多项业务场景和功能支持DeepSeek各个版本。光云科技方面称,将持续推动旗下AI产品与包括DeepSeek在内的大模型深度适配。
当虹科技BlackEye多模态视听大模型正式融合DeepSeek-R1和DeepSeek Janus Pro,并完成视听传媒、工业与卫星、车载智能座舱等多行业垂类场景的数据调优训练。
DeepSeek给AI应用带来更大的想象力,今日金山办公一度触及20cm涨停。不过《科创板日报》了解到,
金山办公尚未与DeepSeek正式合作,有接近金山办公的人士对《科创板日报》记者表示,金山办公正在与Deepseek进行对接测试,未来是否合作要看后续发展
。
在研究层面,杨建预计,各大研究机构都会研究新技术来做预训练和后训练,加快新算法落地。“实际上DeepSeek使用的很多方法是高校研究成果的优秀集成,每年出现那么多新方法,究竟哪些组合才能产生最大产出和价值,可能有很多组合没有被发现,今年肯定有更多的算法创新爆发。DeepSeek只是一个星星之火的燃点。”
在人才方面,杨建判断,大模型应用人才培养会更受重视。“2022-2024年聚集在少数企业,整体业界水平在萎缩。同时,2022-2024年高校并没有培养大模型应用人才。25年春节反应比较快的高校已经开始计划春季大模型应用人才培养,到秋天会覆盖数百所高校会跟随,
今年全国有望培养大模型应用开发人才30-50万
。
科创板日报
服务新质生产力发展,是科创板、新兴产业及未来产业发展的重要新闻媒体,提供媒体、数据、投行、城市产业发展等服务体系,由上海报业集团主管主办,财联社出品。
最新文章
“科八条”后未盈利企业首家!迪哲医药超18亿定增注册获通过
DeepSeek,蹦出个729亿估值!
智驾芯片第一股,涨超37%!
华为,公布26项AI专利
AI眼镜,山雨欲来!
浙江机器人产业基金“上新”
安谋科技换帅!
马斯克,用AI技术调查联邦部门开支
DeepSeek爆火后,美国科技巨头面临灵魂拷问!
OpenAI前联合创始人,新动向!
小米市值,为什么上了万亿?
外交部回应 巴拿马不再续签“一带一路”谅解备忘录
华为AI模型量化专利公布,可减少占用内存
张国清,出席法国人工智能行动峰会
黑芝麻智能:芯片被比亚迪采用并已量产出货
大摩机器人百强图谱出炉!中国制造份额瞩目 这些公司在列
安谋科技新CEO公布!
中国第一代核潜艇工程总设计师黄旭华逝世
雷军:小米汽车提产!
刚刚,黑芝麻智能涨超15%!
特朗普,会见美国钢铁公司CEO
DeepSeek用户量,超越谷歌Gemini!
刘昆,任社保基金会理事长!
北京12寸晶圆厂,增资1999倍!
小米AI眼镜,提前发布
美国“星际之门”数据中心选址曝光
特朗普的俄乌和平计划或下周出炉
湖北500亿AIC基金群再落地
爱博医疗,Q4净利降超三成
李飞飞团队“50美元”复现DeepSeek R1?真相是…...
比亚迪,重磅发布!
DeepSeek“风暴”席卷A股:软件企业忙接入 国产算力迎机遇
DeepSeek引爆本地部署热潮 PC巨头火速响应
“瓜分”谷歌蛋糕?OpenAI宣布免费开放
阿里引进世界级AI科学家
特斯拉弗里蒙特工厂放出多个关键岗位
仕佳光子拟并购整合上游资源 保持MT插芯供货稳定
哪吒,带火了“谷子经济”
李飞飞团队训练出媲美DeepSeek R1的推理模型 云计算费用不到50美元
20亿,四川数据集团!
重庆,力争今年生产130万辆新能源汽车
浙江成立机器人投资基金
DeepSeek香港公司成立!
世界级AI科学家,加盟阿里!
美国再发生撞机事故!
云天励飞,上线DeepSeek R1系列模型
苹果M5芯片,量产!
今日复牌!菱电电控拟收购奥易克斯
6000万!申联生物拟投资世之源
Deepseek,星火已燎原!
分类
时事
民生
政务
教育
文化
科技
财富
体娱
健康
情感
旅行
百科
职场
楼市
企业
乐活
学术
汽车
时尚
创业
美食
幽默
美体
文摘
原创标签
时事
社会
财经
军事
教育
体育
科技
汽车
科学
房产
搞笑
综艺
明星
音乐
动漫
游戏
时尚
健康
旅游
美食
生活
摄影
宠物
职场
育儿
情感
小说
曲艺
文化
历史
三农
文学
娱乐
电影
视频
图片
新闻
宗教
电视剧
纪录片
广告创意
壁纸头像
心灵鸡汤
星座命理
教育培训
艺术文化
金融财经
健康医疗
美妆时尚
餐饮美食
母婴育儿
社会新闻
工业农业
时事政治
星座占卜
幽默笑话
独立短篇
连载作品
文化历史
科技互联网
发布位置
广东
北京
山东
江苏
河南
浙江
山西
福建
河北
上海
四川
陕西
湖南
安徽
湖北
内蒙古
江西
云南
广西
甘肃
辽宁
黑龙江
贵州
新疆
重庆
吉林
天津
海南
青海
宁夏
西藏
香港
澳门
台湾
美国
加拿大
澳大利亚
日本
新加坡
英国
西班牙
新西兰
韩国
泰国
法国
德国
意大利
缅甸
菲律宾
马来西亚
越南
荷兰
柬埔寨
俄罗斯
巴西
智利
卢森堡
芬兰
瑞典
比利时
瑞士
土耳其
斐济
挪威
朝鲜
尼日利亚
阿根廷
匈牙利
爱尔兰
印度
老挝
葡萄牙
乌克兰
印度尼西亚
哈萨克斯坦
塔吉克斯坦
希腊
南非
蒙古
奥地利
肯尼亚
加纳
丹麦
津巴布韦
埃及
坦桑尼亚
捷克
阿联酋
安哥拉