开源日报|用Rust重写C++代码的总结;解读Deepseek V3;AI Agent现状与未来;AI芯片新战役;编程十年的感悟

科技   2024-12-30 21:00   广东  

OSCHINA

↑点击蓝字 关注我们


欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。

每日一更,风雨无阻。

OpenSource Daily # 2024.12.30

省流概览

- 智元机器人重磅开源百万真机数据集 AgiBot World

微软推出本地 AI 开发神器 AI Dev Gallery

FSF 鼓励在 2025 年对微软进行施压

Fish Shell 用 Rust 重写 C++ 代码的总结

苹果在欧盟地区停售 iPhone SE 和 iPhone 14 系列设备

解读 DeepseekV3

AI Agent 的现状与未来

雷军千万年薪挖角 95 后 AI 天才少女,释放什么信号?

AI 芯片新战役:ASIC 登场,GPU 失色


今日要闻

智元机器人重磅开源百万真机数据集 AgiBot World

智元机器人今天重磅发布全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集 AgiBot World。这一里程碑式的开源项目,标志着具身智能领域 “ImageNet 时刻” 已到来。

智元机器人介绍称,AgiBot World 是全球首个基于全域真实场景、全能硬件平台、全程质量把控的百万真机数据集。相比谷歌开源的 Open X-Embodiment 数据集,AgiBot World 长程数据规模高出 10 倍,场景范围覆盖面扩大 100 倍,数据质量从实验室级上升到工业级标准。

未来,智元机器人将陆续开源千万仿真数据,以支持更泛化和更通用的大模型训练;将发布具身基座大模型,可支持模型微调;发布全套工具链,实现采集、训练和评测闭环。

  • GitHub:https://github.com/OpenDriveLab/agibot-world

  • 项目主页:https://agibot-world.com/

微软推出 AI Dev Gallery —— 面向 Windows 11 的本地 AI 开发神器

微软针对 Windows 11 AI+ PC 设备推出了 AI Dev Gallery 功能,旨在帮助开发人员在其应用中尝试各种模型,根据使用场景整合合适的 AI 功能。

该功能已在 GitHub 开源:https://github.com/microsoft/ai-dev-gallery

目前,Windows 11 AI+ PC 设备已支持运行小语言模型(SLM),通过本地调用 AI 模型,响应速度比基于云端的 Copilot 或 ChatGPT 更快。

据了解,AI Dev Gallery 兼容 Windows 10、Windows 11 系统,支持 x64 和 ARM64 架构,为开发者提供超过 25 个示例模型,涵盖文本、图像、代码、音频、视频以及智能控制等多个领域,极大地方便了开发者将 AI 功能集成到应用中。

FSF 鼓励在 2025 年对微软进行施压

自由软件基金会 (FSF) 发布了一篇名为“继续向微软施压(Keep putting pressure on Microsoft)”的文章,鼓励自由软件支持者在 2025 年继续向微软进行施压。

草根组织要对抗微软这样的大公司绝非易事。他们有足够的广告预算来宣称自己 “热爱 Linux”,更不用说有足够的资金和政治意愿来把世界各地的自由软件开发者集中到他们的非自由平台 Microsoft GitHub 上。今年的 IDAD 针对的是一个具体的不公正行为:他们要求强制 “升级” 到 Windows 11 的用户使用硬件 TPM 模块。由于 Windows 10 很快将停止接收安全更新,对于仍在使用该操作系统的用户来说,这是一个(微软制造的)问题。通常,将加密技术转移到不同的硬件模块可以看作是一件好事 —— 但对于非自由软件来说,这只会给用户带来麻烦。

正如我们在今年的行动公告中提到的,我们希望你借此机会与你认识的人分享 GNU/Linux 操作系统,并以此为例解释自由软件的概念。

这些看似微不足道的举动,除了能拯救另一台功能完好的电脑免于成为电子垃圾之外,还能开启一段通往自由的旅程。现在最重要的是继续向微软施压,无论是通过切换到 GNU/Linux、避免使用其软件的新版本,还是采取简单的行动,例如将你的项目从 Microsoft GitHub 上移走。如果你担心电子垃圾,或者有朋友致力于应对气候变化,那么把他们召集起来,向他们介绍自由软件,就是帮助我们的运动发展壮大的最佳方式,也能让更多用户摆脱微软的数字限制。

Fish Shell 用 Rust 重写 C++ 代码的总结

本月初,Fish Shell 4.0 进入测试阶段,C++ 代码被移植到了 Rust。现在,Fish Shell 的大部分代码都过渡到了 Rust,项目团队在日前发布了一篇博文,概述了他们在将庞大的 C++ 代码库移植到 Rust 的过程中取得的成功和遇到的挑战。

Fish Shell 开发人员指出,他们在使用 C++ 时遇到的一些问题导致他们更倾向于探索其他语言,其中包括工具和编译器 / 平台差异、人体工程学和线程安全以及开发社区。其中一个例子是,Fish 曾用 C++ 制作过真正的多线程执行原型,但这对这个开源 Shell 而言是非常痛苦的。

至于 Rust 编程语言,他们承认:"Rust 很酷。它很有趣"。并赞赏了 Rust 的工具性、简单的工具设置、出色的人体工学以及更好的依赖性管理,且 Rust 的发送和同步能力也使其非常适合线程。

苹果在欧盟地区停售 iPhone SE 和 iPhone 14 系列设备

科技媒体 The Verge 报道称,受欧盟新法规影响,苹果宣布在欧盟地区停售配备 Lighting 端口的设备。

据了解,当地时间 12 月 28 日,欧盟委员会 2022 年通过的关于统一充电接口的新规正式生效,电子设备制造商有义务向欧盟 27 国销售的产品配备 USB-C(即 USB Type-C)接口,无法适配的旧设备将逐渐 “退市”。

这项法规还要求支持快速充电的设备支持 USB PD 标准,允许将充电模块与零售设备分开,并通过改进的标签帮助消费者更好地了解他们购买的设备的电源要求。



今日观察

社交观察

解读 DeepseekV3

我见过的最省的 GPT4o,Claude,Gemini2 级别的模型,而且是国内唯一有机会上桌的,其实海外目前和这三家有资格掰手腕的也只有它自己,可以负责任的说其他的模型不配上桌吃菜(Gemini 上个月都没资格)。

其实性能好就不说了,DeepseekR1 就还不错,国内讲道理是第一家做 inference timing scaling law 的模型,阿里是第二家,其他的就不太值得谈论了,其实国外也只有 Gpt 和 google 有资格,没想到年底还能出个 DeepseekV3,在传统 scaling law 这边还能玩出花活儿,实属不易。

- 微博 Transformer-周

AI Agent 的现状与未来

AI Agent 的现状让我想起那个梗图,自动售货机里面藏了个人。大家想象中的 AI Agent 已经开始拥有自主意识了,但实际上的 AI Agent 里面其实藏了个开发者。(这里大家脑补画面,我尝试让 AI 生成这个图片,发现 AI 不能理解 “藏”)。

AI Agent 框架当前扮演一个粘合剂的作用,把 client(Twitter,Discord,Telegram 等) 和各种插件(各链等)粘合起来,然后框架提供一个基础库(记忆存储,会话隔离,上下文生成)等,后面对接各种 AI 平台接口。

- 微博 jolestar

De­e­p­s­e­ek 是站在巨人的肩膀上,使用了大量高质量合成数据

De­e­p­S­e­ek-V3 的训练时间减少和算力需求降低,主要得益于算法优化、硬件适配和模型架构改进。然而,这并不意味着 AI 训练对算力的要求普遍降低,因为 AI 领域的整体趋势仍然是模型规模和复杂性不断增加。我们的优化是针对特定任务和设计进行的,旨在提高效率的同时保持高性能。

- 微博 林毅没有v

DeepSeek-V3 能够降低训练成本的主要技术

DeepSeek-V3 能够降低训练成本的几个主要技术是:① 模型架构改进② FP8 训练 ③ Multi-token Prediction。这几个技术都是既可以用在训练上,也可以用在推理上的。其中①中的两个架构改进(细粒度 MoE 和 MLA),都是 DeepSeek 前期论文发表过的工作,是他们自己独创的改进;②FP8 训练,一起从来没有人能够在这么大规模的系统上能用这么低精度的参数直接训练,这是非常大的成果,节省的训练算力也是巨大的;当然其他模型训练好以后也可以量化到 FP8 进行推理,但从来没有能做到直接用 FP8 训练这么大模型;③MTP 的思想虽然不是 DeepSeek 首次提出的,但他们做了改进并且能够在这么大模型的训练上用起来,这也是第一次。至于蒸馏 R1 的能力,确实是节省了训练成本,但这个主要是带来长链推理(主要是代码和数学)能力的提高,属于锦上添花,不影响模型的基本能力。至于合成数据、数据配比实验等等,这是现在所有模型训练都要做的事情,没有必要跟训练模型本身所用的时间混为一谈。

- 微博 刘群MT-to-Death

AI 工程领域的 50 篇论文、模型和博客文章

Latent Space 从 AI 工程的 10 个领域中挑选了 50 篇论文 / 模型 / 博客:LLMs、基准测试、提示工程、RAG、智能体、代码生成、视觉、语音、扩散模型、微调。

链接:https://www.latent.space/p/2025-papers

- 微博 i陆三金

媒体观察

美国“芯片战”的枉费心机与一错再错

分析人士认为,美国此前单方面挑起对华经贸摩擦,动摇了全球供应链;如今动辄出口管制和鼓励 “回流”,是 “用一个错误解决另一个错误”,其本质不过是一种为一己之私的政治操弄。

- 新华社

重视防范 AI 造假风险

生成式人工智能是当前国内外最热门的 AI 技术形态,因其强大的内容生产功能和强交互性而受到广大用户欢迎。作为一种颠覆性技术的新生事物,生成式人工智能在给经济社会发展带来巨大利好和无限可能的同时,也在法律规范、伦理道德、社会安全、公共治理等方面带来冲击。

- 经济日报

谷歌量子芯片的突破点在哪儿

5 分钟与 1025 年,如此悬殊的数字对比引起了极大关注。有人不禁遐想,这是否意味着可以用 “威洛” 高效地挖比特币、运行大模型?对此,陆朝阳在此前发布的视频中解释:“实际上,谷歌在这项研究中展示的算力并非通用算力,而是只针对 RCS 这一特定数学问题的专用算力。”

- 科技日报

“百镜大战”催热供应链,AI 端侧落地驶入快车道

AI 发展正酣,其在端侧的落地风潮也涌现而至。近期行业厂商齐推 AI 智能眼镜新品,与此同时,部分爆款产品预售全面售罄、相关应用下载量暴增等消息频传,产业链上则有大量公司争相布局,无不显示出 AI 眼镜赛道的 “火热”。

- 财联社

雷军千万年薪挖角 95 后 AI 天才少女,释放什么信号?

事实上,罗福莉被重金招入小米,是小米全面发力 AI 大模型的其中一个动作。2023 年 4 月,小米正式组建了 AI 实验室大模型团队,并表示将不断挖掘 AI 相关的用户场景,发挥自身技术优势,并以开放的态度与合作伙伴开拓更多机会。

- 潇湘晨报

AI 芯片新战役:ASIC 登场,GPU 失色

长久以来,人工智能训练主要依赖于价格高昂的英伟达图形处理器。然而,云服务提供商与初创企业正积极研发成本更低的替代方案,并探索可能实现更高效处理的新途径。苹果采用定制芯片的做法,或许在向其他企业传递一个信号:非英伟达的训练方案同样也能奏效。 

- 半导体产业纵横



今日推荐

开源项目

oracle/tribuo

https://github.com/oracle/tribuo

Tribuo 是 Java 编写的机器学习库,可提供多类分类、回归、聚类、异常检测和多标签分类。Tribuo 提供了流行的机器学习算法的实现,还包装了其他库以提供统一的接口。



开源之声

用户观点

这款 “锈化” 的开源 JS 打包工具发布 1.0 Beta—— 性能强劲、尤雨溪主导

  • 观点 1:感觉优化 js 引擎和运行时才是正道,优化打包器效果不大。

    • 观点 2:让引擎直接支持包管理,不用打包。

  • 观点 3:还是太早期了,慢慢等成熟后再看看。另外,rollback,rolldown 什么的,这些名词看着就有点血压

  • 观点 4:绣化工具我选字节的 rspack,无他,字节自己的网站都在用

  • 观点 5:造轮子也就罢了,一个个名字还那么像

  • 观点 6:rust 更快更安全是共识

  • 观点 7:前端圈沉迷文本处理工具无法自拔

  • 观点 8:难绷,感觉这么发展下去前端的人能重新发明编译器

    • 观点 9:这已经是老历史了~ 写过 coffescript 吗

  • 观点 10:不知道 rsbuild 和用了 rolldown 的 vite 谁更能占据大部分市场?

编程十年的感悟

  • 观点 1:一个在找工作的应届生诚心发问:为什么越学越感觉自己的路越走越窄?一开始想找 C++ 的工作,随着学习的进行,发现和自己对口的工作岗位也越来越少

    • 观点 2:编程只是整个项目的一部分,甚至不是最关键的;最好抽时间了解一下项目开发的流程、拓展业务知识,对后续发展有很好的帮助。祝好运。

  • 观点 3:10 年前我热衷于找一门最好、最漂亮的、最有生产力的语言,10 年后为了养家糊口,我用上了 Omnis 这个小众得不能再小众的语言,但是收入比以前高多了,这就够了。

  • 观点 4:编程这行还是需要一点灵性的,所思所想都决定着下一步的脚印,能让你独立思考的公司,必须好好去自我进化,人生能有几个十年。与优秀的人在一起久了,就像跟老板在一起久了,你也就成了老板,眼界、思想。在这个科技时代,还是得学会利用科技反哺自己才行,不能只会一味的创造科技,然后接了个电话,走着走着就挂了。

  • 观点 5:10 万小时学数学还是菜鸟的恐怕不少

  • 观点 6:感谢开源与终身学习,喜欢这篇文章



程序员梗图





References

https://weibo.com/7800251567/P7ey6ymJN
https://www.oschina.net/news/327171/ai-dev-gallery-run-ai-models-on-windows-11-locally
https://www.oschina.net/news/327051/fsf-pressuring-microsoft-2025
https://www.oschina.net/news/327176/fishshell-rustport
https://www.oschina.net/news/327172/apple-pulls-lightning-based-devices-from-european-stores
https://weibo.com/1871474290/P6Rc9Fabr
https://weibo.com/1648815335/P75MLj2xn
https://weibo.com/1327306000/P6XQw9ERT
https://weibo.com/1917491813/P75Ba2bvv
https://weibo.com/1706699904/P6XKWdTxR

https://baijiahao.baidu.com/s?id=1819750440356827417&wfr=spider&for=pc

http://www.ce.cn/cysc/tech/gd2012/202412/30/t20241230_39251120.shtml

https://news.ustc.edu.cn/info/1056/90248.htm

https://baijiahao.baidu.com/s?id=1819779315718857651&wfr=spider&for=pc

http://news.hnr.cn/shxw/article/1/1873549137185939458

https://36kr.com/p/3097999754055424

https://github.com/oracle/tribuo

https://mp.weixin.qq.com/s/a8b-evpR-Olm57U44Aq0RQ

https://mp.weixin.qq.com/s/rNizP6lRycuH9V2l56JatQ


END




分享在看点赞~Orz

OSC开源社区
开源中国,只关注开源圈、技术圈的硬核内容,与嬉笑怒骂。
 最新文章