“中字头”新国企,正式揭牌 / DeepSeek,突传重磅!

百科   2025-02-09 22:05   北京  


“中字头”新国企,正式揭牌

据新华社消息,记者28日从中国五矿集团有限公司获悉,中国盐湖工业集团有限公司于8日正式揭牌,这意味着央地协同打造具有国际影响力的盐湖产业航母迈出了重要一步。

图为中国盐湖集团所属五矿盐湖生产厂区。(中国五矿供图)

来自中国五矿的信息显示,目前中国盐湖集团旗下有青海盐湖工业股份有限公司、青海汇信资产管理有限责任公司、五矿盐湖有限公司3家企业,注册资本100亿元,中国五矿持股53%,青海省国资委和青海省国有资产投资管理有限公司共同持股47%

据介绍,中国盐湖集团现有530万吨/年钾肥、5.8万吨/年锂盐、百万吨/年盐湖化工产品产能。集团生产基地包括全国最大的可溶性钾镁盐矿床察尔汗盐湖和大型硫酸镁亚型盐类综合矿床一里坪盐湖,采矿面积近4060平方公里,盐湖提钾、盐湖提锂规模化生产技术世界领先。

中国五矿有关负责人表示,下一步,中国五矿将全力以赴推动世界级盐湖产业基地建设,牢固树立绿色发展理念,通过技术创新引领产业创新,实现青海盐湖由资源变材料、由材料变产品、由产品变产线,最终实现盐湖资源综合利用价值最大化,最大程度提高国家粮食安全和资源能源安全保障能力。

来源:新华社



同期阅读:

DeepSeek,突传重磅!

白杨 杨娜娜

2月8日晚,又有多家知名巨头宣布接入DeepSeek大模型。

工信部:三家基础电信企业均全面接入DeepSeek开源大模型

京东云发布DeepSeek大模型一体机

商汤大装置上架DeepSeek系列模型

此外,多家汽车企业纷纷宣布完成与DeepSeek模型的深度融合。其中,吉利汽车宣布,其自研的星睿大模型与DeepSeek-R1已完成深度融合;岚图汽车宣布,岚图汽车的智能座舱已与DeepSeek完成深度融合;东风汽车也宣布,已完成DeepSeek全系列大语言模型的接入工作。

DeepSeek“朋友圈”再扩容!

21数据新闻实验室统计,随着DeepSeek热度飙升,其“朋友圈”亦在加速扩容,多家公司宣布接入DeepSeek模型,各行业正掀起智能化升级的浪潮。

目前都有哪些公司已经接入了DeepSeek?21数据新闻实验室带你一图速看>>

图源/21数据新闻实验室 作者:朱芷葵,吴怀宽

DeepSeek最新声明

2月6日晚,DeepSeek发文强调:近期注意到部分与 DeepSeek 有关的仿冒账号和不实信息对公众造成了误导和困扰。目前,DeepSeek 仅在以下社交媒体平台拥有唯一官方账号:

不到50美元就能训练出媲美DeepSeek R1的模型?

DeepSeek对AI行业的震撼仍在持续发酵时,又一则“炸裂”的AI新闻引发全球关注。

近日斯坦福大学和华盛顿大学的研究人员发表的一篇研究论文显示,他们以不到50美元的云计算费用,训练出一款名为S1的推理模型。该模型在数学和编码能力测试中,与OpenAI的o1和DeepSeek的R1表现不相上下

要知道,DeepSeek之所以惊艳世界,正是因为它以远低于OpenAI的训练成本,做出了与其水平相当的产品。如今,若真的能将这一成本降至不到50美元(约364元),那无疑是AI领域的又一次重大突破。

然而,事实并非如此。

根据研究论文,S1模型并不是从零开始训练,而是以阿里通义千问Qwen2.5-32B-Instruct开源模型为底座,然后在16块H100 GPU上进行了26分钟的监督微调(STF),最终训练出新模型S1-32B。

在推理能力方面,研究人员则通过蒸馏技术,从谷歌的AI推理模型Gemini 2.0 Flash Thinking Experimental中提取了推理能力。

某大模型厂商的研发人员告诉21世纪经济报道记者,S1模型本质上是在前人研究的基础上复制了推理能力,而非真正创新。

他进一步指出,蒸馏技术虽然可以大幅降低模型训练成本,但它并不能创造出全新、更强大的推理模型。“这意味着,蒸馏出来的模型永远无法超过被蒸馏的模型”。

DeepSeek R1大有不同

准确来说,S1模型的核心在于“模仿”。研究团队通过蒸馏技术,将谷歌模型的推理过程和能力迁移到S1模型上,并通过监督微调进一步优化其表现。

因此,S1模型的训练过程相对简单,成本也更低。它使用的数据集仅包含1000个问题及其推理过程。

此外,研究团队还开发了一种名为“预算强制(budget forcing)”的技术,通过在模型尝试结束生成时强行终止其思考过程,或通过多次附加“等待”来延长思考时间。这种方法可以使模型重新检查其答案,从而提高推理的准确性。

然而,无论是从训练方法、成本,还是模型数据来源和优化策略上,S1与DeepSeek R1都有着本质的区别。

DeepSeek R1是通过强化学习训练的,它在训练过程中能够不断自我调整,并通过奖励机制强化正确的推理路径,最终达到较高的推理能力。

R1的优势在于它能够在动态环境中进行调整和优化,因此具有更强的适应性和处理复杂情境的能力。而S1只是复制已有模型的能力。

多位明星基金经理布局DeepSeek概念股

截至2月7日,DeepSeek指数的26只成分股中,按自由流通市值排序,前五分别为金山办公、科大讯飞、传音控股、中科曙光、三六零。前四大个股流通市值均破1000亿元。

截至2月7日收盘数据

从机构持仓情况来看,不少ETF和明星基金经理管理的主动权益基金早已布局了DeepSeek相关概念股。

节后的三个交易日(2月5日—7日),每日互动等多只DeepSeek概念股涨停。截至2024年三季度末,每日互动十大流通股东中,香港中央结算有限公司位居第六大流动股东。优刻得-W的前十大流通股东中,南方中证1000ETF和华夏中证1000ETF在列。上述两只ETF同时也出现在万兴科技、拓尔思的前十大流通股东名单中。拓尔思的前十大流通股东中,还有易方达中证人工智能ETF和广发中证1000ETF两只ETF。

卫宁健康的前十大流通股东中,华宝中证医疗ETF、易方达创业板ETF以及南方中证500ETF三只ETF分别位列第三大、第五大、第七大流通股东。此外,招商基金投资老将朱红裕管理的招商核心竞争力A也位列第四大流通股东。

安恒信息的前十大流通股东中,则有两位公募明星基金经理管理的3只基金出现。这三只基金分别是万家基金黄兴亮管理的万家行业优选和万家自主创新A,以及汇丰晋信基金陆彬管理的汇丰晋信动态策略A,分别位列安恒信息的第三大、第六大以及第九大流通股东。

截至2024年三季末,金山办公的前十大流通股东中,还出现了华夏上证科创板50ETF、华夏上证50ETF、易方达上证科创板50ETF以及目前(截至2月5日)规模达3500多亿的华泰柏瑞沪深300ETF。

截至2024年末,持有金山办公数量最多的前15只基金中,多只基金为去年四季度新进买入金山办公为前十大重仓股。

万家基金莫海波管理的万家品质生活、万家新兴蓝筹、万家甄选在2024年四季度新进金山办公为前十大重仓股,分别买入145万股、90万股、86万股;大成基金王帅管理的大成互联网思维新买入95万股,中欧基金周蔚文参与管理的中欧新蓝筹也新进金山办公为重仓股,买入67万股。

东吴基金权益投资总监刘元海表示,DeepSeek的模型推理成本较同类产品大幅降低,且无需依赖最先进芯片,这将引发市场对于海外龙头芯片公司GPU需求可持续性的担忧。2025年对科技行业充满信心,将重点关注AI硬件、汽车智能化、AI人形机器人以及AI算力等细分方向。

另有私募香橙资本创始人何潇在最新的投资观点中透露,自己已经“全力挥出2025年的重要一杆,目前的组合是满仓状态,投资方向是港股科技股”。香橙资本向21世纪经济报道记者表示,目前香橙资本的国内基金规模在14亿左右,计划将在20亿元规模附近关闭募资窗口。

何潇进一步解释,1月初加仓时,虽然DeepSeek还未“横空出世”,但自己对中国整体工程师红利及大厂们在应用端的能力是自信的,并看好AI重估的机会。他认为,中美科技股价值重估是必然事件,即使没有DeepSeek的催化,也会有下一个现象级应用端在国内诞生。


延伸阅读:

DeepSeek,“朋友圈”爆了

孙媛 来源:猎云精选

再不交友,就out了?

AI圈的当红辣子鸡,已经引发了厂传厂“交友”的现象级表现。

国内,云厂商跑得最快。

2月1日,华为云就打响第一枪,随后腾讯云、阿里云、百度智能云、京东云、联通云等主流云平台也相继宣布接入DeepSeek系列模型。

同期,DeepSeek的这股“接入热”还蔓延到了各大芯片厂商、应用端企业,呈现出“提速”态势。

短短一周内,不仅海光信息、摩尔线程等芯片厂商宣布适配上线,上市公司奇安信、视觉中国、易点天下、盛天网络、神州数码、万兴科技等更是密集宣布:接入DeepSeek。

而这股“交友”热潮在国内还算是“虽迟但到”。

要知道,早在1月底,微软、英伟达、亚马逊、英特尔、AMD等海外巨头们就相继拥抱,纷纷跟DeepSeek牵起了手。

何以至此,还得从今年春节DeepSeek的一炮而红谈起。

半个月前,国产开源大模型DeepSeek-R1正式发布,在数学、代码、自然语言推理等任务上性能对齐OpenAI-o1正式版,可谓一鸣惊人。

更关键的是,DeepSeek-R1用的还是更经济的计算资源,推理成本仅为OpenAI-o1的几十分之一,其开源的路径,更是降低了各领域AI应用的研发成本,可以有效加速大模型应用创新和普及。

这也就意味着以低成本已可训练出足够好的AI模型,这将是一场通往AGI时代的技术普惠。

众所周知,AI界苦降本增效久矣,打出“高性能、低成本”牌的DeepSeek,自然成为了香饽饽。

他们,都在跟大模型黑马“交朋友”

截至目前,DeepSeek“朋友圈”的企业可一分为三来看。

首先,是春江水暖鸭先知的云厂商们,每天都有新人在官宣进场。

国内云服务厂商无问芯穹来的最早,在1月28日除夕一大早宣布了其Infini-AI异构云对DeepSeek-R1-Distill 32B模型的支持。

随后四大云巨头中,当属华为云最快。

2月1日就在官微宣布,与硅基流动联合首发并上线基于昇腾云服务的DeepSeek R1/V3推理服务,表示“其性能可与全球高端GPU部署模型相媲美”。

腾讯云阿里云,则分别以“开发者仅需3分钟即可接入调用”“用户可零代码实现从训练到部署再到推理的全过程”主打“一键部署”的高效。

百度智能云靠“卷”出圈,早早打出低价牌,推出“超低价格方案及限时免费服务”。

京东云跟联通云则划出“按需部署”的关键词,前者“支援公有云线上部署及专混私有化实例部署两种模式”,后者“兼顾私有化和公有化场景,提供全方位运行服务保障”。

从云厂商的角度来看,他们率先与DeepSeek实现深度对接,无论是为了构建AI生态,丰富平台的AI服务、还是降低成本,亦或是吸引开发者、满足客户的多样化需求,快速接入最火的大模型,都是笔划算的买卖。

再到芯片厂商,更是全球闻风而动,为DeepSeek提供算力支持。

这里面,不在春节假期的海外公司占了先机。

1月31日,英伟达宣布,NVIDIA NIM已经可以使用DeepSeek-R1。同日,微软称已将DeepSeek-R1正式纳入Azure AI Foundry。亚马逊云科技(AWS)也宣布:企业和开发者可以在Amazon Bedrock和Amazon SageMaker AI中部署DeepSeek-R1模型。

2月2日,沐曦联合GiteeAl发布全套Deepseek-R1千问蒸馏模型,DeepSeek-V3满血版在国产沐曦GPU首发体验上线。

随后在2月4日,摩尔线程、天数智芯、海光信息同天入局,其中,海光信息技术团队已完成DeepSeek V3和R1模型与海光DCU的适配并上线,摩尔线程也宣布,已实现对DeepSeek蒸馏模型推理服务的部署。

此外,DeepSeek系列模型首发即支持昇腾平台,神州数码旗下神州鲲泰推理服务器产品搭载昇腾硬件,可全面支持DeepSeek系列模型的快速部署。

而这场AI盛宴,应用端自然也不会缺席。

在网络安全应用上,奇安信自研QAX安全大模型通过DeepSeek-R1进行了一系列的优化和蒸馏,运营成本实现了大幅降低,同时在威胁研判等多个场景下的模型性能方面获得了显著提升。

其中安全专业问答整体性能分数提升约16%,极大提升了智能威胁分析和决策的准确度。

数字创意软件公司万兴科技2月4日也宣布,旗下视频创意、绘图创意及文档创意软件业务多款产品完成了与DeepSeek-R1的深度适配,包括万兴喵影、亿图图示、亿图脑图MindMaster、万兴PDF等。

此外,在应用侧接入DeepSeek的相关企业还有推动视觉内容服务领域AI技术应用进一步升级的视觉中国、智能营销服务商易点天下、智能视频解决方案与视频云服务商当虹科技以及互联网和移动安全产品及服务提供商三六零。

从云到芯片再到应用,DeepSeek卷起的全球AI风暴,已然深度卷进产业中的每一位玩家。

来源:猎云网

“AI界拼多多”,要走出一条生态路

值得注意的是,DeepSeek的爆火,并不是偶然。

这还得从它的基因说起。

据天眼查显示,DeepSeek公司全称为“杭州深度求索人工智能基础技术研究有限公司”,简称“深度求索”,成立于2023年7月,公司股东为宁波程恩企业管理咨询合伙企业(有限合伙)(即知名量化资管巨头幻方量化)和创始人梁文锋。

从股东便可看出,彼时下场大模型的深度求索,有的是量化基金的背景,在一众AI大牛创业中,有点宛如异类。

但是优势也非常明显:资金、团队、硬件,它齐了。

幻方量化于2015年成立,通过AI技术优化量化投资策略,2021年公司管理规模就突破千亿元,成为国内量化私募四巨头之一。

也由此,梁文锋跟团队积累了量化投资和高性能计算领域的深厚背景和丰富经验,同时伴随的还有AI能力。

根据《财经十一人》内容,2023年国内拥有超过1万枚GPU的企业就包括了幻方量化。早在2019年,幻方就成立了AI团队,自研深度学习平台。

这些,都足以让深度求索在大模型圈低调前行。

当时,在《暗涌》的文章中,幻方目标很明确,“深度求索”强调专注做真正人类级别的人工智能,目标是研究——开源——推动行业发展,最终通向AGI。

在文章中,梁文锋更是坚定认为“OpenAI不是神,不可能一直冲在前面”。

这些都奠定了DeepSeek的基调,不是模仿,而是原创,不是学徒,而是挑战者。

成立半年后,第一代大模型DeepSeek Coder便发布,同月还率先开源中国首个MoE大模型(DeepSeek-MoE)。

2024年5月,其第二代开源Mixture-of-Experts(MoE)模型——DeepSeek-V2面世,因为DeepSeek V2模型因在中文综合能力评测中的出色表现,且以极低的推理成本引发行业关注。

也是这一次,DeepSeek有了“AI界的拼多多”之称。

去年底,全新系列模型DeepSeek-V3首个版本上线并同步开源,根据公开信息,DeepSeek V3的表现几乎追上了Anthropic Claude 3.5 Sonnet和OpenAI GPT-4o。

Meta AI研究科学家田渊栋都给出了赞赏,称“这是一项了不起的工作”。

再到成本上,官方技术论文更是披露,DeepSeek-V3模型的总训练成本为557.6万美元,而GPT-4o等模型的训练成本约为1亿美元。

强烈的成本对比之下,直接让DeepSeek谱写了AI界的新神话。

彼时,深度求索对外表示,“这是一个全新的开始。”也由此,DeepSeek在AI圈开始有了些许声音。

今年1月20日,DeepSeek-R1模型正式发布,并同步开源模型权重。与此同时,DeepSeek应用(不包含网站数据)上线5天日活就已超过ChatGPT上线同期日活,成为全球增速最快的AI应用。

随后,乘着超预期的产品体验带来的口碑裂变,DeepSeek迎风而上,在1月28日发布开源多模态模型Janus-Pro。

其中,70亿参数版本的Janus-Pro-7B模型在使用文本提示的图像生成排行榜中优于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。

截至2月2日,DeepSeek登顶140个国家的苹果App Store下载排行榜首位。到2月4日,上线20天,DeepSeek日活突破2000万,创下新纪录。

C端的火爆,自然也为B端的国内外生态圈快速搭建埋下伏笔。

手持低价和开源并行的策略,无疑成为DeepSeek朋友圈引爆的催化剂。

而建立更大更完善的生态,正是DeepSeek发展的未来所在。

近日,梁文锋对《暗涌》说,在这波AI浪潮中,DeepSeek的出发点是走到技术前沿,去推动整个生态发展。他们只负责基础模型和前沿的创新,其它公司在DeepSeek的基础上构建toB、toC的业务。

正如英伟达的领先不只是一个公司的努力,也是整个西方技术社区和产业共同努力的结果。

他说,“中国AI的发展,同样需要这样的生态。”

(首图来源:图虫)





PS:亲爱的读者朋友们:因微信更改了推送规则,推文不再按照时间线显示,不是所有观粉,都能在第一时间收到文章,有观粉误以为我们没更新。所以,需要各位老铁在每次看文章后,在文章尾端右下角,点一下在看,每天只需点一下即可。如果不点“在看”或者没有“星标”,就可能看不到我们的推送了!如果您不想错过“中小企业”的精彩内容,就赶紧星标⭐我们吧!


中小企业
为地区制定产业规划,为企业在产业中定位;为企业创立品牌,提升品牌价值;整合优秀供应商;为企业建立融资、投资的通道。
 最新文章