刚刚过去的周末,DeepSeek(深度求索)刷屏爆火,引发多方热议。资料显示,Deepseek来自国产大模型公司深度求索,系量化巨头幻方量化旗下大模型公司。成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。在1月27日,DeepSeek应用登顶苹果美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT。同日,苹果中国区应用商店免费榜显示,DeepSeek成为中国区第一,其火爆程度“可见一斑”。有分析指出,DeepSeek爆火的原因主要可以归结为两点:性能和成本。据DeepSeek介绍,其最新发布的模型DeepSeek-R1在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上,性能比肩OpenAIo1正式版。
在成本上,有媒体报道指出,DeepSeek的R1的预训练费用只有557.6万美元,仅是OpenAI GPT-4o模型训练成本的不到十分之一。同时,DeepSeek公布了API的定价,每百万输入tokens 1元(缓存命中)/4元(缓存未命中),每百万输出tokens 16元。这个收费大约是OpenAI o1运行成本的三十分之一。“DeepSeek以较低的成本实现了高性能的AI模型,这使得其在市场竞争中具备了显著的优势,这种成本效益比无疑会吸引大量企业和个人用户选择其产品和服务。”北京社科院副研究员王鹏表示。据广州日报,萨摩耶云科技集团首席经济学家郑磊称,DeepSeek对硬件市场产生了重大影响,因为它可能会降低人工智能模型的硬件成本,从而推动人工智能技术的发展。受消息发酵,A股市场AI概念股早盘集体爆发,每日互动20CM涨停,拓尔思涨幅超17%,普联软件涨超16%,南威软件、视觉中国涨停。而与之相反的是,算力硬件方向个股大幅走低。其中寒武纪盘中跌幅超9%,新易盛、中际旭创、天孚通信、沃尔核材、鼎通科技、神宇股份等均跌超5%。
值得一提的是,美股市场AI显卡龙头“英伟达”也受影响,夜盘跌近5%。
#小财唠嗑#
新媒体编辑:徐铮