↑点击蓝字 关注我们
欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻。
OpenSource Daily # 2025.1.7
省流概览
- TIOBE 2024 年度编程语言:Python
- 零一万物辟谣“被阿里收购”传闻
- 智元机器人完成 1000 台通用具身机器人下线
- 腾讯回应被列入美国防部名单:是个错误
- 中国信通院发布 MaaS 六大标准
- 英伟达推出 128G 内存的桌面计算机 NVIDIA DIGITS
- 使用大模型编程的一些经验
- 完全由正则表达式驱动的国际象棋引擎
- 算力基础设施建设将加快
今日要闻
TIOBE 2024 年度编程语言:Python
TIOBE 宣布 2024 年度编程语言花落 Python,该语言在 2024 年的涨幅高达了 9.3%;远远领先于其竞争对手:Java +2.3%、JavaScript +1.4% 和 Go +1.2%。
TIOBE CEO Paul Jansen 点评道,“如今 Python 无处不在,它是许多领域无可争议的默认语言。它甚至可能成为 TIOBE 指数中排名最高的语言。Python 唯一的严重缺点(因此为竞争留下了空间)是性能不足,并且大多数错误发生在运行时。”
零一万物辟谣 “被阿里收购” 传闻
针对网传 “阿里收购零一万物” 一事,零一万物发文辟谣称 “相关传闻不实”。
公告指出,零一万物与阿里云于 1 月 2 日联合宣布启动 “产业大模型实验室”。进入新的一年,双方的深度合作框架顺利落地,正积极推进相关的实施方案。针对传言零一万物将被收购、经营问题等不实言论属于恶性中伤,公司予以否认。
李开复在朋友圈辟谣称:“2024 年,零一万物的确认收入一个多亿 (订单更多),2025 年会数倍增长。不知为什么会有这样的谣言散播。”
智元机器人完成 1000 台通用具身机器人下线
智元机器人官宣,其量产的第 1000 台通用具身机器人于 2025 年 1 月 6 日正式下线,其中双足人形机器人远征 A2 / 灵犀 X1 为 731 套,轮式通用机器人远征 A2-/A2-W 为 269 套。目前,这些机器人正在陆续交付客户中。
根据介绍,智元机器人 2023 年 2 月成立,同年 8 月打造出人形机器人原型机;2024 年 8 月,针对交互服务、柔性制造、科研教育等多元场景,推出 5 款通用机器人,并在 12 月开源了全球首个百万真机数据集。
腾讯回应被列入美国防部名单:是个错误
1 月 7 日早间,针对美国国防部将腾讯公司列入中国军工公司名单(根据美国法律正式规定为 “第 1260H 条清单”),腾讯回应称,
“腾讯被列入这份名单显然是一个错误,我们并不是军工企业或军工供应商。不同于出口管制或其他,这份清单对我们的业务没有影响。尽管如此,我们仍将同美国相关部门共同解决误会。”
美国国防部在当地时间周一表示,已将包括腾讯、宁德时代在内的中国科技巨头列入名单。
中国信通院发布 MaaS 六大标准
据中国信通院 CAICT 官方公众号消息,为解决 MaaS 平台服务质量参差不齐、选型困难等问题,信通院推出了 MaaS(Model as a service,模型即服务)系列标准。
中国信息通信研究院紧跟 MaaS 领域最新发展趋势,依托中国人工智能产业发展联盟于 2023 年成立 MaaS 工作组,联合产学研各界专家共同启动 MaaS 系列标准编制,经过一年多的持续努力,现正式发布 MaaS 系列标准。本系列标准围绕 MaaS 落地中遇到的问题,聚焦大模型定制调优、大模型服务部署和推理加速、模型管理、大模型应用开发等维度,提出能力要求,为大模型服务商和平台供应商提供能力建设参考,为应用方提供技术选型依据。
今日观察
社交观察
老黄刚刚把牙膏剂爆了!出了个 128G 内存的桌面计算机 NVIDIA DIGITS
老黄刚刚把牙膏剂爆了!出了个 128G 内存的桌面计算机 NVIDIA DIGITS!没错,可以拿在手上的超级 AI 计算机。大模型可以玩到爽了!甚至是不是可以自己炼大模型了!
但是,朋友们但是来了哦,注意内存下面的小字,这是 LPDDR5X,不是 GDDR6,更不是 HBM2,跟苹果用的内存其实是一样的。虽然高达 128G,但是根据 NVIDIA Grace CPU 的 datasheet,Grace CPU 的内存带宽只有 512GB/s...... 所以跟 Apple MacBook Pro M4 Max 差不多... (70b-4bit 大模型大概 13token/s 的速度)
虽然现在 NVIDIA 还没有放出 DIGITS 的具体数据,还是希望内存带宽能高一些....
- 微博 karminski-牙医
使用大模型编程的一些经验
David Crawshaw(Tailscale 公司的创始人)介绍了他用大型语言模型编程的一些经验 crawshaw.io/blog/programming-with-llms
作者在过去的一年里积极探索并使用大型语言模型进行编程,发现这种技术可以显著提高工作效率。他在编程中使用 LLMs 的方式主要有三种:自动补全、搜索和基于聊天的编程。
作者强调,LLMs 在编程中的应用不仅仅是提供代码片段,更是一种新的编程范式,需要程序员学习如何与之合作。他还提到,LLMs 在处理复杂的编程任务时,尤其是在编写测试和处理编译器错误方面,可以提供宝贵的帮助。此外,作者还分享了他在使用 LLMs 时的一些具体实践,例如如何编写一个用于计算浮点数四分位数的保留样本器,并展示了如何通过 LLMs 生成和改进测试代码。
- 微博 蚁工厂
RAG 基础知识到高级实现的开源指南
指南名为 bRAG-langchain,它能帮你从基础到进阶,一步步搭建 Retrieval-Augmented Generation(RAG,检索增强生成)系统。
https://github.com/bRAGAI/bRAG-langchain
该教程是一个系列,里面不仅有实战例子,还涉及了很多前沿技术,比如 CRAG 和多向量检索,特别适合那些想深入了解 RAG 的开发者。
而且啊,教程还是用 Jupyter Notebook 实现的,每个部分都有详细的讲解和代码示例,从环境配置、数据加载,到向量存储和检索优化,基本上能覆盖你想要实现的各种功能。
最重要的是,它还提供了一个可自定义的聊天机器人模板,让你可以轻松创建属于自己的 RAG 应用。
- 微博 量子位
完全由正则表达式驱动的国际象棋引擎
Nicholas Carlini 这篇文章介绍了自己如何使用 84,688 个正则表达式构建了一个双层 MiniMax 国际象棋引擎。具体而言,作者是先用正则表达式写了个 CPU 模拟器,然后在这个 cpu 模拟器上写了个编译器,然后用编译器写了个国际象棋引擎。引擎名为 "Regex Chess",可以根据输入的棋盘状态走出一手合理(且不完全糟糕)的棋步。
nicholas.carlini.com/writing/2025/regex-chess.html
- 微博 蚁工厂
媒体观察
新一轮数字基础设施布局开启
国家发展改革委、国家数据局、工业和信息化部三部门近日联合印发《国家数据基础设施建设指引》(以下简称《指引》),提出到 2029 年,国家数据基础设施建设和运营体制机制基本建立。这标志着中国开启新一轮以数据为中心的数字基础设施布局。
- 人民日报海外版
“人工智能+”应当怎么加
把握“人工智能+”带来的机遇,需要相关部门在战略规划、科研投资、人才培养等方面更加重视前瞻布局,而成效则主要体现在领军企业、新兴企业是否能够发挥主导作用。同时,确保人工智能安全、可靠、可控,有利于人类文明进步,是人工智能发展必须解决的重要课题。因此,必须始终坚持以人为本、科技向善,把人机协调贯穿始终,促进人类智能、离身智能、具身智能相互协调。
- 经济日报
车企驶入 “人形机器人”赛道的背后
细细想来,从汽车到机器人,有着不少共通之处。业界曾用 “轮子上的机器人” 形容不断进阶的汽车。不论是无人驾驶,还是座舱内智能互动,今天,搭载着人工智能、视觉传感、大模型等技术的汽车,越来越像陪伴人类出行的智能机器人。同样,在人形机器人的研制中,高性能电池、轻量化材料,以及目标识别、路径规划等算法,诸多软硬件都可以从智能网联汽车中得到借鉴。车企造机器人既有着技术迁移的可能性,机器人进入汽车工厂 “实训”,也便于降低研发成本、加快应用示范。
- 新华社
算力基础设施建设将加快
杜广达表示,我国将加快推进人工智能与互联网融合发展,引导互联网企业结合自身优势,挖掘算力、算法、数据潜力,融入并壮大人工智能产业,培育发展新质生产力,为新型工业化提供有力支撑。
- 中国证券报
美股新财路!争先恐后和英伟达搞合作,股价立即腾飞!微软 800 亿美元搞 AI
这给我们提供了一种新的思路 —— 关注那些和科技巨头如英伟达有深度合作的公司。它们通过技术合作,不仅在行业中获得了技术和市场的双重加持,还能够大幅提升未来的成长潜力。从这些公司身上,我们看到了技术创新对股价的直接推动,也看到了资本市场对未来增长的强烈预期。
- 美股大数据
粉丝几千万的雷军,为什么从来不翻车?
在这个自媒体蓬勃发展的时代,应该说,雷军给其他企业家树立了一个好榜样。企业家的职能,就是为消费者提供好的产品,随意跨出这一职能,恐怕将来都是要翻车的。
- 功夫财经
今日推荐
kamiyaa/joshuto
https://github.com/kamiyaa/joshuto
joshuto 是一个用 Rust 编写的类似 ranger 的终端文件管理器。
开源之声
用户观点
Deepseek 团队核心成员揭秘 —— 清北应届生撑起一片天
观点 1:本地部署使用了,效果一般
观点 5:隔壁 qwen2.5 70b 就很好
观点 2:你哪儿来的 352 块 GPU 本地部署?
观点 3:我用的在线的,感觉还是挺强的
观点 4:这种大模型没库还不训练的话本地部署都不怎么好吧
观点 6:数学证明写的跟 4o mini 差不多水平,没啥推理能力
观点 8:一道题没有统计意义,我做开发大量用 deepseek 和 gpt 还是 claude,国产垫底,但在国内也是矮子里面拔将军
观点 7:逻辑推理能力还可以,我用了一道逻辑推理题,gpt4o,三次答案都是错的。deepseek 都是对的,虽然推理过程比较繁琐。
程序员梗图
References
https://www.gov.cn/zhengce/202501/content_6996612.htm
http://www.ce.cn/cysc/tech/gd2012/202501/07/t20250107_39258519.shtml
https://baijiahao.baidu.com/s?id=1820482074629154184&wfr=spider&for=pc
http://union.china.com.cn/cmdt/txt/2025-01/07/content_43006031.html
https://xueqiu.com/3305476551/319597628
https://baijiahao.baidu.com/s?id=1820549822122170148&wfr=spider&for=pc
https://github.com/kamiyaa/joshuto
https://mp.weixin.qq.com/s/-xOV7aB8cMrxZ4YShbOWlQ
END
↓分享、在看与点赞~Orz