迎春茶话会

财富 2025-01-27 08:01 山东

今天是龙年的最后一个工作日，大部分人都已经在路上甚至到家了，少部分人像星空君还坚守在工作岗位。

在路上也没心情看文章，在班上也没心情写文章。

就和大家唠唠嗑。

一、关于DeepSeek的八卦

1、蒸馏

最近的当红炸子鸡必须是DeepSeek，很多懂的不懂的朋友在星空君关于DeepSeek的文章下面激烈的讨论。

星空君手头的项目已经装入DeepSeek的开源模型了，准备节后开始训练。

讨论没有问题，问题是要有一定的门槛。

比如DeepSeek有r1-zero版本，有v3版本，有r1版本。其中，最受欢迎的r1使用了所谓蒸馏技术。

有些朋友就误以为DeepSeek蒸馏了OpenAI的数据。

事实上，r1-zero是自训练而来，v3和r1则蒸馏了DeepSeek自己的模型。

所以不存在蒸馏其他模型的情况。

2、苏妈的暴击

DeepSeek在国外也火的一塌糊涂，在huggingface下载已经超百万。整个IT圈都在热烈的讨论DeepSeek。

最近AMD宣布Mi300X 原生支持ds R1, 比英伟达节省30%的成本。

网友戏称，这比正月里理发的伤害还要大（网传苏妈辈分上是黄皮衣的外甥女）。

3、30美元复现

DeepSeek用了550万美元干了OpenAI上百亿美元的事，这不算完。

无论是斯坦福还是MIT，都在热情的讨论DeepSeek并投入狂热的使用中。

梁文峰发表了DeepSeek的论文后，来自UC伯克利博士生潘家怡和另两位研究人员，在CountDown游戏中复现了DeepSeek R1-Zero。

他们表示，结果相当出色！

实验中，团队验证了通过强化学习RL，3B的基础语言模型也能够自我验证和搜索。

更令人兴奋的是，成本不到30美金！！！

AI迎来新时代。

对于DeepSeek有什么损失吗？

没有。

第一DeepSeek不差钱，第二DeepSeek开源的目的就不是为了在AI底座上赚钱。

那靠什么？

卷应用。

HuggingFace团队官宣复刻DeepSeek R1所有pipeline。

复刻完成后，所有的训练数据、训练脚本等等，将全部开源。这个项目叫做Open R1，当前还在进行中。

从DeepSeek开始，高不可攀的AI将拆掉所有护城河。

4、Meta工程师的帖子

这两天在疯传Meta工程师的帖子：

一切源于DeepSeek V3的出现，它在基准测试中已经让Llama 4相形见绌。更让人难堪的是，一家「仅用550万美元训练的中国公司」就做到了这一点。

工程师们正在争分夺秒地分析DeepSeek，试图复制其中的一切可能技术。这绝非夸张。

管理层正为如何证明GenAI研发部门的巨额投入而发愁。当部门里一个高管薪资就超过训练整个DeepSeek V3的成本，而且这样的高管还有数十位，他们该如何向高层交代？

DeepSeek R1的出现让情况更加严峻。具体细节属于机密，不便透露，不过很快就会公开了。

这本该是一个以工程为导向的精简部门，但因为太多人想分一杯羹，人为膨胀招聘规模，最终导致人人都付出了代价。

DeepSeek改变了游戏规则。

二、关于蛇年的第一天

有个小盆友和星空君闲聊，他的生日是腊月的，出生那年立春在腊月，有人说属相的第一天是立春，有人说属相的第一天是正月初一，导致搞不清楚自己到底属相是什么。

星空君也曾经认真研究过这个问题，从干支纪年法的角度进行了史料的查阅。

一度推导出立春是干支纪年法的第一天（事实上，算命先生都是这么认为的）。

然而突然有一天，星空君发现了最重要的一点：历法是官方修的。

这意味着，只有官方背书的历法，才是准确的。

官方怎么说的呢？

现在负责修历法的官方机构是中科院紫金山天文台，说的很清楚，大年初一是新年第一天。

大年初一在古代叫元旦，又叫元日，王安石有一首名篇：

元日
爆竹声中一岁除,
春风送暖入屠苏。
千门万户曈曈日,
总把新桃换旧符。

后来孙中山把元旦放到了公历第一天，袁世凯又把本来用在立春上的春节放到了大年初一。

还有一个冷知识，生肖纪年是有国标的... ...

2017年颁布的国家标准《农历的编算和颁行》（标准号：GB/T 33661-2017）也明确规定了生肖纪年的循环参考时间，对应干支纪年法。如公历1984年2月2日0时（大年初一）起到1985年2月19日24时截止的农历年为甲子年，对应生肖为鼠年。

祝大家旅途愉快！

诗与星空

以财报为核心的上市公司分析。出版清华大学出版社《上市公司财报分析实战》，中国铁道出版社《财技-一本书教你看懂上市公司财报》。

最新文章

哪吒的逆跌

长城汽车业绩暴涨却遭打脸

一份惊叹的研究报告

DeepSeek杀死传统IT企业，踢开数据资产时代

AI改变投资分析

英伟达上架DeepSeek，股票继续跌

如何看待deepseek对AI大模型产业的影响

春晚上扭秧歌的BOT

迎春茶话会

经济学的释经权

星际之门：中美的新版星球大战计划都来了

共享经济背后的“隐形巨头”，成长性不足

一个增加利润的神秘财技

集采大对账：中药企业的“高质量发展”

信披涉嫌违规，数据资源入表疑云

业绩巨亏，腰斩的隆基绿能

2024年全国出生人口954万人

全世界人民团结起来，到小红书上对账

台积电供应商登陆科创板

业绩巨亏，董事长辞职，国资出手

又见财务造假！重大违法，强制退市

华为注资，芯片细分领域前十强

独董辞职，买船运车去海外

《欧盟市场禁止强迫劳动产品条例》，并非你想象的那样

六代机和大模型：桌子上的阳谋

被列入清单？手把手教你用AI分析宁德时代财报

拉胯的比亚迪供应商

车路协同怎么不提了？

暴涨！第一份2024年业绩预告

比亚迪的迪链=恒大商票

在隆冬，我终于知道

OpenAI掌门人：希望中美能在AI领域保持合作，避免军备竞赛

外贸新气象

当年借大基金蛇吞象，如今亏百亿出手

恒大后遗症，又一家上市公司解约普华永道

AI大模型将改写赚钱逻辑

圣诞遇冷，舔狗经济崩盘了？

山东经济怎么样？明年山东怎么干？

阿里巴巴“提前”发布2025财年财报

芯片行业已经过饱和了？

无力回天，独董跑路

恒瑞医药，重回山巅？

海康威视没了4000亿？

大萧条时期，写在故事里的生活触目惊心

“谷子经济”爆火背后：再见了，所有的（EVA）GDP！！！

明星产品被印度封禁！

警惕上市公司12月变更会计估计

京东方董事长60岁再就业，进军这个领域

浙文互联处置豆神教育，上市公司年底套路多

A股最大财务造假案的签字会计师，天塌了

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉