2025.01.26 晚间三分钟

财富   其他   2025-01-26 19:58   湖南  


新来的朋友请看这里

这个只是我本人的操作记录,不是任何投资建议。另外我也不开设任何QQ群和微信群,如有冒称请注意辨别。我不会私下联系你们,如有人联系,请注意辨别,看名字是否和我的有细微差别。我也不收取任何费用。不要给陌生的人或者机构转账,不要让钱离开你的账户。五日线上持有,五日线下走。不要老问怎么操作。

每天20:00 发送晚间文章


特朗普称,他正在与多人就收购TikTok进行谈判,可能将在未来30天内对TikTok的未来做出决定。

特朗普25日说,他可能会考虑重新加入世界卫生组织。

特朗普最大的不确定性就是出尔反尔,朝令夕改。

小红书对账最让我惊讶的不是中国用世界7%的耕地养活了世界21%的人口。而是美国用世界5%的人口贡献了世界70%的血浆。果真是美国一直在为世界输血。

我很久没坐过高铁了。特别是春运。今年感觉很多人都没钱过年所以不回家。那些坐高铁的朋友是不是觉得高铁比以前春运空爽了呢?

周末热的事件就是中国的deepseek,这个上次炒过一波。主要是别的大模型化几十亿,上百亿训练,而deepseek只用了不到600万美元,几十块GPU就训练出来了。而且效果很好。

本来这件事情都过去了,但是周五一条发布在匿名平台teamblind上的帖子疯传。一名Meta员工称,现在Meta内部因为DeepSeek的模型,已经进入恐慌模式。
这位Meta员工写道:“一切源于DeepSeek-V3的出现,它在基准测试中已经让Llama 4相形见绌。更让人难堪的是,一家‘仅用550万美元训练预算的中国公司’就做到了这一点。工程师们正在争分夺秒地分析DeepSeek,试图复制其中的一切可能技术。这绝非夸张。管理层正为GenAI研发部门的巨额投入而发愁。当部门里一个高管的薪资就超过训练整个DeepSeek V3的成本,而且这样的高管还有数十位,他们该如何向高层交代

关键Deepseek现在是开源的,而ChatGPT3.5后不开源了。

在之前ChatGPT刚开始操作的时候,很多人说中国已经彻底落后了,我当时说了,中国是稍微落后一点,但是很容易追赶,也就是1,2年的时间。现在一看,用了1年多已经追上了。而且成本是他们的千分之一。那这他们的大模型还怎么打?彻底没市场了啊。成本相差这么多。

硬件其实比较难追一点,因为设计到很多行业的协作。是整体水平的提升才能追。而软件其实就是算法,只要你足够聪明,算法精妙,很简单就能追上。就比如你有个计算器很厉害,算1+2+3……+100,你敲得速度飞快,已经是世界第一了。但是有个人突然发现这个算式只要用(1+100)*50=5050 一步就算出来了。那么之前那个再练这个速度也已经是毫无用处了。

美国很多高科技领域都是华人在做,最近几年他们在高科技领域排华,其实是削弱了他们的科研能力。

那么周一关于Deepseek的炒作肯定是开盘就顶了。但很多人认为既然Deepseek只要几十块GPU就训练出来了,那么那些万卡集群不就没用了吗。这个我觉得是对科技发展的无知。算力是无止境的,不会多。有时在没有找到更好方法的时候,只能大力出奇迹。就算找到更优算法后,更高的算力也会提供更快的速度和功能更强大的未来提升空间。所以不能认为AI硬件就能停止。算力不会过剩。因为还有智能驾驶,机器人等都需要巨大的算力。

不过生成式大模型的缺陷就是逻辑不够严谨,所以不能进行精确的数据计算。

我下了个Deepseek用了两天,之前我觉得豆包是中国第一,现在觉得豆包大概是小学6年级水平,Deepseek大概是高中水平。已经足够应付日常的文字处理。

这样的硬件需求完全可以在手机和PC上正常运行简化模型了。

2025是科技从1到100的一年。也就是前几年的一些科技成功会逐步市场化,甚至有些企业可能会盈利了。AI助手,智能驾驶,智能机器人。而在科技的应用方面,没有一个国家会是中国的对手。所以可以预见美国在这方面都会落后中国。中国唯一要做的就是继续搞AI硬件,争取算力的完全自主。

那么再按照我上面说的逻辑,软件容易追,硬件才难。所以未来赚钱的公司不会是大模型公司。而是那些硬件公司。因为大模型算法一旦突破,就会很容易开发,会有很多竞争对手出现。会陷入价格战。而硬件的话由于专利的保护,以及长的研发周期及大量的设备投入,所以护城河会稍微宽一点。

所以也许会冒出各种大模型题材,不管怎么优秀的大模型。最终基础还是算力。千炒万炒,算力不会不炒。

事实也是如此,为什么是华为,小米等有硬的公司赚钱。而不是华软,东软等软件公司赚钱呢?

早间三分钟
点赞率很高的公众号