开源日报|Qwen-VL大模型全面降价；华为轮值董事长孟晚舟新年致辞；技术债务就像是幸存者的战斗伤痕；国产AI舞台站满90后天才

科技 2024-12-31 21:00 广东

OSCHINA

↑点击蓝字关注我们

欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里，我们每天从宏观到微观，全面展现开源技术和文化的动态图景。

每日一更，风雨无阻。

OpenSource Daily # 2024.12.31

省流概览

- IBM 计划收购 HashiCorp，遭英国反垄断监管机构审查

- 阿里云再度降价：Qwen-VL 大模型全面降价

- 智谱深度推理模型 GLM-Zero 预览版上线

- Altman 公布 OpenAI 2025 年将发布的技术产品

- 华为轮值董事长孟晚舟新年致辞

- “全球互联网上中文内容比例很低”是一个误读

- 一个大模型需要多大 GPU 内存才能跑起来的计算公式

- 国产 AI 舞台，站满了“90后天才”

- “国产英伟达”们，扎堆上市

- 冷眼与嘲讽之后，谷歌的 AI 大模型翻盘之路

今日要闻

IBM 计划收购 HashiCorp，遭英国反垄断监管机构审查

据 TechCrunch 报道，英国反垄断监督机构竞争与市场管理局（CMA）已开始调查 IBM 计划收购云软件厂商 HashiCorp 是否会影响竞争。

CMA 周一表示，它将在 1 月 16 日前邀请有关各方就这一并购发表评论。该监管机构暂定 2 月 25 日为最后期限，以决定是批准该交易还是将其提交进一步审查。

IBM 于今年 4 月宣布同意以约 64 亿美元的价格收购 HashiCorp。如果收购继续进行，将扩大 IBM 在云计算和人工智能领域的推进力度，并让该公司获得 HashiCorp 约 4400 家客户的名册。

CMA 于 8 月通知 HashiCorp 将对合并进行审查。美国联邦贸易委员会也在调查这一交易。

阿里云再度降价：Qwen-VL 大模型全面降价

阿里云今天宣布，Qwen-VL 大模型全面降价。这是阿里云本年度的第三轮降价。

Qwen-VL-Plus 模型价格直降 81%，输入价格仅为 0.0015 元 / 千 tokens，创下全网最低价格；而更高性能的 Qwen-VL-Max 降价至 0.003 元 / 千 tokens，降幅达到 85%。根据新的定价，1 元钱可以最多处理大约 600 张 720P 图片，或者 1700 张 480P 图片。

Qwen-VL 系列大模型是阿里云推出的多模态大模型，已成为开源社区最受欢迎的模型之一，具备强大的视觉推理能力。该模型不仅能够识别不同分辨率和长宽比的图片，还能理解 20 分钟以上的长视频，并具备自主操作手机和机器人等智能体的视觉理解能力。

智谱深度推理模型 GLM-Zero 预览版上线

智谱宣布发布本年度最后一个模型 GLM-Zero 的初代版本 GLM-Zero-Preview，这是智谱首个基于扩展强化学习技术训练的推理模型。

根据介绍，GLM-Zero-Preview 是 GLM 家族中专注于增强 AI 推理能力的模型，擅长处理数理逻辑、代码和需要深度推理的复杂问题。同基座模型相比，GLM-Zero-Preview 在不显著降低通用任务能力的情况下，在专家任务能力方面的表现大幅提升，其在 AIME 2024、MATH500 和 LiveCodeBench 评测中，效果与 OpenAI o1-preview 相当。

模型表现如下：

Altman 公布 OpenAI 2025 年将发布的技术产品

OpenAI 首席执行官萨姆・奥特曼（Sam Altman）发帖公布了该公司 2025 年即将发布的技术产品，分别是：

AGI（通用人工智能）
Agents（智能体）
更好的 GPT-4o 升级版
更好的记忆存储
更长的上下文窗口
“Grow up mode”（成人模式）
深度研究特色功能
更好的 Sora 以及更好的个性化定制

华为轮值董事长孟晚舟新年致辞：2024 年是原生鸿蒙关键一年，一年走过其它操作系统十多年发展之路

据华为官网显示，华为轮值董事长孟晚舟今日发布新年致辞，对客户、生态伙伴、产业链伙伴、员工和家属等表达了感谢。

她在致辞中提到，在万物智联的赛道上，2024 年是原生鸿蒙的关键一年，鸿蒙生态建设千帆起航。鸿蒙千帆计划得到了众多行业伙伴的积极响应，短短一年时间，我们就走过其它操作系统十多年的发展之路，创造了“鸿蒙速度”。

今日观察

社交观察

“全球互联网上中文内容比例很低”是一个误读

有人用图一来说明全球互联网上中文内容比例很低，只占 1.4%，实际上这是一个误读。我以前说过一次，这个数据统计方法并不是计算文字量或者网页数量，而是计算使用某种语言的网站数量。

举个例子，微博网站在这个统计中，只能将样本数字 + 1，别管微博上边有多少中文内容，在这个统计方法中，微博跟万年没人看的某些个人站没有区别，都只算一个网站。同样是 W3Techs 提供的数据，图二就很能解释这个问题，只是中文网站数量少，并不是中文内容少。

- 微博 BugOS技术组

一个大模型需要多大 GPU 内存才能跑起来的计算公式

一个大模型需要多大 GPU 内存才能跑起来的计算公式：M = ((P * 4B) / (32 / Q) ) * 1.2

M: 所需的 GPU 显存，单位是 GB。
P: 模型的参数数量。例如，7B 模型有 70 亿个参数。
4B: 每个参数占用的字节数，这里假设每个参数占用 4 个字节（通常指 FP32 或 Float32 格式）。
32: 4 个字节等于 32 位。
Q: 加载模型时使用的位数。例如，16 位 (FP16/BF16)，8 位 (INT8) 或 4 位 (INT4)。这通常称为量化。
1.2: 表示额外开销的系数，通常为 20%。这考虑了除了模型权重之外还需要加载到 GPU 显存中的其他数据，例如优化器状态、梯度等。

如使用 FP16 量化加载 Llama 70B 模型，计算过程就是
M = ( (70,000,000,000 * 4) / (32 / 16) )* 1.2 = 168 GB

- 微博蚁工厂

大模型导航资源

分享个大模型导航资源，里面收集了几乎全部的模型，具有里程碑意义的论文，排行榜，测试集，训练框架，部署，应用，书籍等

github.com/Hannibal046/Awesome-LLM

- 微博 karminski-牙医

英伟达虽然欠下来了大量的“技术债务”，但在他看来“技术债务就像是幸存者的战斗伤痕。”

关于先做个垃圾出来，读《英伟达之芯》又看到了一个好例子：

3dfx 破产之后，一个加入英伟达的员工被英伟达的代码库震惊到了，“简直就像是癌症”“代码写得一塌糊涂，开发工具链也是一团乱麻，最重要的是，他们对此毫不在意”“他们一心只想着下一块芯片流片，其他什么都不顾。”

而之前 3dfx 的工作方式则是追求完美，他在那里写出的程序优雅，开发的系统条理清晰、注释详尽，但结果却是一败涂地。

他给的总结相当精辟，英伟达虽然欠下来了大量的 “技术债务”，但在他看来 “技术债务就像是幸存者的战斗伤痕。”

- 微博 i陆三金

媒体观察

AI 发展：训练数据即将遭遇瓶颈

训练数据即将遭遇的瓶颈已悄然浮现。有研究机构预测，到 2028 年左右，用于训练 AI 模型的数据集典型规模将达到公共在线文本总估计量的规模。换句话说，AI 可能会在大约 4 年内耗尽训练数据。与此同时，数据所有者（如报纸出版商）开始打击对其内容的滥用行为，进一步收紧了访问权限，这将引发 “数据共享” 规模上的危机。为此，开发人员必须寻找变通之道。

- 科技日报

全面拥抱人工智能 —— 访 360 集团创始人周鸿祎

我国人工智能大模型具有广阔发展前景，但要在全球大模型产业竞争中赢得主动，一是要充分发挥我国制度优势，与国外通用大模型展开竞争；二是充分用好我国工业种类齐全、场景众多的优势，将大模型和各种应用场景结合，推动一场新型工业革命，这是实现发展 “弯道超车” 的关键。

- 经济日报

国产 AI 舞台，站满了“90后天才”

从资本到产业对人才的大手笔抢先押注现状来看，有关 AI 的比拼，无疑不止算力，而更在于人才。

- 科创板日报

“国产英伟达”们，扎堆上市

因此，GPU 企业想要快速发展，必然离不开资本的助力，冲击上市仍是 “国产英伟达” 们获取资金弹药的重要途径。

而在等待资本市场的大门开启之前，它们也需要直面生存的考验。张建中曾直言，“摩尔线程目标为至少先存活 10 年”。在这场 “国产替代” 光荣而艰辛的征途中，中国算力企业的竞逐才刚刚开始。

- 财经天下WEEKLY

冷眼与嘲讽之后，谷歌的 AI 大模型翻盘之路

谷歌正在逐渐夺回大模型竞赛的行业关注度和开发者认同，反垄断大锤还尚未真正落下，谷歌获得了一个难得的发展窗口来在新的技术革新潮流中暂时站稳脚跟，为下一个人工智能时代真正到来前做好准备。

- 锦缎研究院

AI “爆改”快递行业的第二年

从简单的寄件、查件入手，到面向快递小哥打造 “知识库”、再到帮助完成业务信息的汇总整理，甚至到供应链的智慧控制，大模型在快递行业的能力正在被逐步释放。选择私有化部署模型、自研大模型的快递公司们都相信一点：大模型是值得的长期投资，它在快递行业的应用上限仍然有一个广阔空间等待发掘。

- 光锥智能

今日推荐

开源项目

liriliri/aya

https://github.com/liriliri/aya

AYA 是一款内置 ADB 并基于其功能编写用户界面的桌面应用。相比于原始的 ADB 命令行输入，AYA 安装傻瓜，功能齐全，全图形化界面，一键操作，极大地提高用户效率。

开源之声

用户观点

最强开源终端模拟器 Ghostty 正式发布 1.0：原生 UI 体验、采用 Zig 编写、速度飞快、支持 Mac 和 Linux、支持 GPU 加速

观点 1：什么玩意？不支持 windows？我今晚就去提 issue，炮轰作者
观点 2：不至于，README 里有写是有计划支持 Windows 的。终端模拟器不支持 Windows 是非常常见的情况
观点 3：zig 比 rust 吹实在
观点 4：只要 C ABⅠ 在行业上占大头，zig 就永远实在。zig 直接调用 C 真的很爽！
观点 5：完全可以理解，等下就去试试。Who care Windows?
观点 6：和 Rust 写的 Warp 比如何？Zig 应用越来越多，好事。
观点 7：Warp 性能不太行，输出多了卡，不知道后续的版本会不会优化
观点 8：目前在用 wezterm，感觉真正的 killer feature 是 multiplexing，tmux 快捷键记不住。目前看 ghost 没有 multiplexing，也没有 tmux integration，期待。
观点 9：好吧，我还是用 WinTerm 吧
观点 11：我看不懂源代码，所以不存在放心与否～
观点 10：你不觉得这玩意反应要慢半拍么，而且伪开源不让人放心。
观点 12：不知道跟 wezterm 比起来怎么样
观点 13：用上了，之前用 wezterm，个人感觉比 wezterm 更简洁高效。两个都很好。
观点 14：可以替换掉 iTerm2 了
观点 15：我用 powershell7.5

程序员梗图

References

https://www.oschina.net/news/327292

https://www.oschina.net/news/327323

https://www.pingwest.com/w/301378

https://www.pingwest.com/w/301401

https://www.pingwest.com/w/301379

https://weibo.com/3146485692/P6Fdbs7pg

https://weibo.com/2194035935/P6DrHa8Ob

https://weibo.com/2169039837/P7e1GcOVX

https://weibo.com/1706699904/P6mWLnFlv

https://baijiahao.baidu.com/s?id=1819939622972077660&wfr=spider&for=pc

http://www.ce.cn/cysc/tech/gd2012/202412/30/t20241230_39251115.shtml

https://baijiahao.baidu.com/s?id=1819927511172343210&wfr=spider&for=pc

https://baijiahao.baidu.com/s?id=1819926514777138655&wfr=spider&for=pc

https://baijiahao.baidu.com/s?id=1819915034550649526&wfr=spider&for=pc

https://tech.ifeng.com/c/8fjJTSFA8ou

https://github.com/liriliri/aya

https://mp.weixin.qq.com/s/jS984AtnzvXfNwjPVFakZg

END

↓分享、在看与点赞~Orz

OSC开源社区

开源中国，只关注开源圈、技术圈的硬核内容，与嬉笑怒骂。

LFOSSA感谢信：2024年回顾与2025年展望

微软CEO Nadella 预言：软件行业将发生天翻地覆的变化！

开源日报|树莓派5将推出16GB内存版本；爱奇艺起诉Minimax索赔10万元；为啥最强开源CPU是中国的；Cursor开源替代

罗永浩AI创业项目J1 Assistant首次亮相：智能助理软件、UI“梦回”锤子手机，“闪念胶囊”的AI版本？

在研究了400家公司后，我发现了AI创业的真相

Deepseek团队核心成员揭秘——清北应届生撑起一片天

Nodejs的竞争者Bun又整活了，Bun.s3预告

夜莺开源监控突破一万 star，当我们离开的时候希望世人还记得我们

苹果Safari浏览器上的一个怪象——更白的白色

开源日报|Top 15中国互联网公司全部盈利；百度网页版新增“AI搜”；AI公司爬虫无视robots.txt协议；年度数据库回顾

用Rust重写近6万行C++代码是怎样的体验？

Star超9k，开箱即用，企业LLM应用开发平台BISHENG直播来咯

2024年度数据库回顾

开源日报|Qwen-VL大模型全面降价；华为轮值董事长孟晚舟新年致辞；技术债务就像是幸存者的战斗伤痕；国产AI舞台站满90后天才

2024年系统编程语言调查报告：Rust稳居榜首、Zig紧随其后

「AI 为伍重启征程」2024 OSC 源创会年终盛典在珠海圆满落幕

中国AI的进步之快，让美国人开始怀疑现实了

开源日报|用Rust重写C++代码的总结；解读Deepseek V3；AI Agent现状与未来；AI芯片新战役；编程十年的感悟

最强开源终端模拟器Ghostty正式发布1.0：原生UI体验、采用Zig编写、速度飞快、支持Mac和Linux、支持GPU加速

蚂蚁集团泰初：基于Ray构建统一AI技术栈更有优势

谈谈DeepSeek-v3提到的基础设施演进

2024年AI盘点：投资高歌猛进、基础设施重构、技术采用加速

编程十年的感悟

开源日报|DeepSeek-V3发布；微软与OpenAI发生争执；ChatGPT本月第二次大规模宕机；Ruby 3.4发布

这款“锈化”的开源JS打包工具发布1.0 Beta——性能强劲、尤雨溪主导

开源中国新版APP公测，邀请万名老用户有奖体验

DeepSeek-V3 正式发布

开源日报|小米正在搭建GPU万卡集群；2024全球AI盘点；张一鸣“撞上”雷军；微软变脸OpenAI；苹果为何一直拒用英伟达？

在读计算机女博士退学转战OnlyFans——狂赚百万美金、还清贷款

CodeFuse：让研发变得更简单

地平线/智源/字节/凌川科技齐聚上海，共探编译器优化新进展

突发！GitLab（国际版）将停止对中国区用户提供GitLab.com账号服务

开源日报|AI眼镜明年会火；计算机女博士转战OnlyFans；编程十年感悟；苹果回应不自建搜索引擎；美国对中国芯片发起301调查

本周六，源创会老友们，珠海见！

前端年度大事件盘点：尤雨溪成立公司、ECMAScript 2024发布，以及各大框架重磅更新……

这么多年排序白学了，原来每次排序都在使用世界上最快的排序算法 TimSort

开源日报|2024系统编程语言调查报告；M4 MBA明年发布；IBM为开源项目提供永久免费服务器；智能代理RAG与传统RAG区别

程序员身边都有这样的队友

小猪骑大象：PG内核与扩展包管理神器

开源日报|华硕电脑圣诞节彩蛋“翻车”；只有GPT 3.5称得上突破；curl放弃支持Hyper；OpenAI发布推理模型o3

华硕电脑的圣诞节彩蛋整了个烂活——不仅看上去像感染病毒、还导致内存泄漏

中国基础软件和世界优秀软件的差距在哪？

MySQL 8.0/8.4执行DDL会丢数据？是，但影响有限

GitHub Star数量两天破万——Home Assistant的米家官方集成有什么优势？

AI原生开发平台MoonBit（月兔）开源核心编译器

开源日报|全新桌面版ChatGPT；图森未来退市转型；国产前端开源项目被投毒；LLM供应商Top10；淘宝搜索正在“杀死”淘宝

两款知名国产前端开源项目被“投毒”

Gitee AI携手无问芯穹：模型+算力，共创本土化AI社区新篇章

“2024全球十大工程成就”公布：文生视频大模型Sora、嫦娥六号、无人驾驶汽车等入选

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉