最近,最火的新闻应该就是deep seek的横空出世。
一直以为这是一群IT精英卧薪尝胆十几年的成果,今天仔细了解一下,确实让人吃惊到词穷!
Deep seek甚至是在ChatGPT问世之后才成立的!
创始人梁文峰从2008年直到2023年,他的主攻方向一直是金融。
长达15年的时间里,他靠量化交易积累了无数资本,2021年他的幻方量化投资甚至已经成了国内量化私募四巨头!
在2022年ChatGPT人工智能模型问世之后,梁文峰对此产生了极大的兴趣,并且于2023年成立了deep seek。
140人的团队,2000多块的低端GPU,研发投资不到600万美元,居然做成了deep seek!
可以说,中国人工智能公司 DeepSeek本周震惊了市场,该公司声称其新的人工智能模型性能优于 OpenAI。
但构建成本仅为 OpenAI 的一小部分。
这些断言——特别是 DeepSeek 的大型语言模型的训练成本仅为 560 万美元。
——引发了人们对科技巨头目前在训练和运行高级 AI 工作负载所需的计算基础设施上花费的巨额资金的担忧。
由于投资者担心 DeepSeek 的颠覆性影响,周一英伟达的市值蒸发近 6000 亿美元——这是美国历史上公司单日最大跌幅。
但并非所有人都相信DeepSeek 的说法。
而且,一些人声称 DeepSeek 的技术可能不是从零开始构建的。
OpenAI 自己也曾暗示过这一说法。
其在周三的一份声明中告诉 CNBC,它正在审查有关 DeepSeek 可能不当使用其模型的输出数据来开发其 AI 模型的报告,这种方法被称为蒸馏。
OpenAI 发言人向 CNBC 表示:
我们采取积极主动的对策来保护我们的技术,并将继续与美国政府密切合作,以保护在这里建造的最强大的模型。
更加吊诡的是:
1月28日,DeepSeek官网显示,其线上服务受到大规模恶意攻击。
奇安信安全专家透露,DeepSeek这次受到的网络攻击,IP地址都在美国。
通过对DeepSeek持续近1个月的监测发现:攻击模式从最初的易被清洗的放大攻击,升级至1月28日的HTTP代理攻击(应用层攻击,防御难度提升),现阶段已演变为以僵尸网络为主。攻击者使用多种攻击技术和手段,持续攻击DeepSeek。
奇安信表示,1月30日凌晨观察到2个Mirai变种僵尸网络参与攻击,分别为HailBot和RapperBot。
此次攻击共涉及16个C2服务器的118个C2端口,分为2个波次,分别为凌晨1点和凌晨2点。
DeepSeek 被指控盗窃知识产权。
被大规模网络攻击。
美国icon商标被抢注。
新的技术路线意味着绝大多数国家被归于了几乎同一起跑线,这一点对原有先发优势的国家是不能接受的。
DS的意义不仅是中国制造,更重要的是提供了新的技术路线,而且是开源的,这让全世界打破了美国的技术垄断,有点儿实力的国家都可以在AI领域与美国掰掰手腕。
你支持DeepSeek吗?你觉得能够跟美国那边掰掰手腕了吗?