价格杀疯了

财富   2025-01-26 17:28   北京  

国产大模型DeepSeek疯狂刷屏,我也蹭热点闲扯几句。


咱们短话长说。




1

史前时代

一百年前有位俄罗斯大胸弟马尔可夫,他认为每件事发生的概率取决于前面的N件事。

今天股价涨跌,取决于前面N天的K线。


今天天气冷热,取决于前面N天的温度。


今天门店销量,取决于前面N天的销量。


。。。


马尔可夫妥妥的技术分析流派,一整个淘股吧用户既视感。


人工智能或者说机器领域有个长期存在的概念叫GPgenerative pre-trained的缩写。


早期的GP照搬马尔可夫的逻辑,一个字一个字按顺序理解人类自然语言,每个字的意思取决于前面N个字。


我们每天使用的汉字输入法、微信语音输入,都是这样实现的,相当简单粗暴。


缺点方面,人类一句话可能超级长,可能从句多层嵌套,可能结构倒装,处理起来效率略低,而且容易丢失隐藏在上下文中的语义。




2

颠覆式创新

2017年,谷歌八位研究人员放出一篇论文《Attention Is All You Need》,抛弃逐字处理的方法,同时处理多个字,通过每个字和其它字的关系来理解整句话。

新方法被命名为Transformer


八位研究人员写信给公司高层说,Transformer属于颠覆性创新,建议谷歌用新方法替换已有的搜索引擎。


谷歌觉得没必要,等其它公司先试水再说。


八人陆续辞职,各奔前程。




3

堆料堆算力

初创公司OpenAI看到谷歌的论文,被深深震撼,迅速把论文变成产品,产品名字GPTGP加上T组成,TTransformer的意思。

2018年推出GPT-1,使用7000本小说做训练数据,参数1.17亿。


2019年推出GPT-2,训练数据包括800万份文档和4500万个网页,参数15亿。


2020年推出GPT-3,训练数据570G,参数1750亿。


。。。

OpenAI冲在前面开路,全球各大公司纷纷跟进,大家一起疯狂堆料堆算力,算力成为行业门槛。




4

价格大战

最近,国产AI公司DeepSeek以价格屠夫的形象高调进场。

通过性能优化,DeepSeek用十分之一算力达成同类产品差不多的性能。


DeepSeek没有更好用,但它更便宜。


随着成本下降,价格大战一触即发,已经杀疯了。




5

从2到95

科技行业有个共识,美国公司擅长从02和从95100的过程,中国公司擅长从295

谷歌发布论文,是从01


OpenAI发布ChatGPT,是从12


大家都站在前人肩膀上干活。

现在已经快进到295的阶段。


闲画生财
简单投资 聪明赚钱