↑点击蓝字 关注我们
欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。
每日一更,风雨无阻。
OpenSource Daily # 2024.11.15
省流概览
今日要闻
小米成立 AI 平台部,任命张铎为 AI 平台负责人
上周小米进行一系列人事变动,其中基础技术平台部成立 AI 平台部,张铎(duó)担任 AI 平台部负责人,向基础技术平台部总经理冯宏华汇报,组织上基础技术平台部属于小米技术委员会。张铎在 2016 年 - 2021 年间任职小米,曾被雷军在微博公开表示:张铎是小米的大神。
Cursor 母公司 Anysphere 收购 AI 编码助手 Supermaven
人工智能代码编辑器 Cursor 背后的公司 Anysphere 已收购人工智能编码助手 Supermaven,收购金额尚未公开。
Anysphere 首席执行官 Michael Truell 在 Cursor 博客上宣布了这笔交易。他认为 Supermaven 将推动 Anysphere 加快推出 Tab AI 模型的新版。“我们有很多事情要做,而且看起来我们可以一起更快地构建一个更有用的产品。”Truell 表示 Supermaven 的插件将继续维护,但 Cursor 仍然团队的核心关注点。
Superrmaven 的创始人是 Jacob Jackson,他之前曾与他人共同创立了 AI 编码助手 Tabine,后加入 OpenAI。Supermaven 成立于今年 2 月,是一个类似于 Tabnine 的 AI 编码平台,其内部生成 AI 模型 Babble 可以同时理解大量代码,而且由于采用了定制架构,延迟极低。
OpenAI 为 macOS 版 ChatGPT 引入第三方集成
11 月 15 日,OpenAI 为 macOS 版 ChatGPT 引入第三方集成。用户现在可以让 ChatGPT 读取特定软件中的内容,首批支持的应用包括 VS Code、macOS Terminal、iTerm2 和 Xcode。
通过该功能 ChatGPT 能直接理解 Xcode 项目中的代码并提供建议,无需用户手动复制粘贴。该功能目前仅限于 macOS,需订阅 ChatGPT Plus 或 Team 版。企业和教育用户将在未来几周内获得访问权限。用户可随时管理 ChatGPT 的读取权限以保护隐私,OpenAI 计划未来将其扩展到更多应用。
高通发布基于 RISC-V 架构的智能家居芯片
高通于 11 月 13 日推出多款基于 RISC-V 架构的可编程连接芯片。其中,QCC74xM 芯片模块支持 Wi-Fi 6、蓝牙 5.3、Thread 和 Zigbee 等协议,适用于智能家居集线器和其他智能家居设备;该模块还支持有线连接,可通过以太网和 CAN(常用于车辆)进行通信。
另一款芯片 QCC730M 是微功耗 Wi-Fi 4 模块,主要用于电池供电设备,如 Wi-Fi 安全摄像头或智能锁;CPU 频率为 60MHz,内存容量为 640KB,并配备硬件加速以支持加密安全算法。这两款芯片预计于 2025 年上半年投入商用。
RWKV-6-World-7B-v3 模型正式开源发布,新增 3.1T 训练数据
2024 年 11 月 13 日,RWKV-6-World-7B-v3 模型正式开源发布。
对比 RWKV-6-World-v2.1 模型,RWKV-6-World-v3 模型新增了 World-v3 数据集(约 3.1T tokens),对比 v2.1 数据集补充了优质英文网页、代码、中文小说、多语言数据、数学数据、指令数据等。
更多的训练数据带来更好的模型性能,RWKV-6-World-7B-v3 的各方面能力显著增强,包括中文小说、对话、代码、数学能力。
今日观察
社交观察
Sam 说 “There is no wall”,有些人就 high 了
Sam 说 “There is no wall”, 有些人就 high 了,抛去 Sam 这人既往言论的准确度不提,数据 Wall 存在不是一天两天了。
实际上 GPT4oL 和 Claude sonetV2, 已经把人类目前截止有价值的数据在 pretrain 阶段能用的都用了,而且还是反复清洗,数据增强的那种,有人说新的数据比如特朗普当选,GPT4oL 不知道,但这种数据对模型的智能提升其实是没意义的。
所以 Sam 所说的 Wall 是什么?如果他不是故弄玄虚,这个 Wall 指的是 Scaling Law, 因为 Scaling Law 不止和数据有关,也和模型参数有关 (Deepmind 和 OpenAI 的所谓 模型参数 / 数据 的比值只是个经验值,远没有真正的去触碰到边界)。
此外,最值得提的是预训练和后训练,预训练其实现在还远没到上限,可以提升的点很多,后训练的 Scaling Law 更是刚刚起步,o1 目前的状态大概相当于当年的 gpt2,也远没到链推理 + 搜索的 gpt4 时刻,能做的工作更多。有人看过 information 的文章就说 Orion 碰到了数据墙,不行了之类的,就开始以讹传讹,实际上 Orion 的训练,据我了解到完成度还不到 25%,结果就被定义为不行了.....
- 微博 Transformer-周
给经常编程的同学未来一年的投资建议
无论你编程水平如何,非常菜或者非常牛,花 $20 美元一个月购买 Cursor 的会员,坚持每天大量使用它的 AI 功能,相当于你花 20 美元一个月雇了一个实习生,雇了一个老师,可以大幅提升你的开发效率和学习效果!
20 美元一个月买不了吃亏买不了上当,坚持使用一段时间后你会来评论感谢我的。
- 微博 宝玉xp
越来越多的专利流氓公司(Patent Troll)起诉开源项目侵权
最近,越来越多的专利流氓公司(Patent Troll)起诉开源项目侵权,尤其是针对成功和有影响力的项目,比如 Kubernetes 相关的开源项目。CNCF 不胜其烦,昨天在 KubeCon 开幕式上的第一个话题就是如何应对专利流氓的碰瓷。
CNCF 宣布一个专门针对专利流氓的奖励计划 -” 云原生英雄挑战”,鼓励云原生开发者和技术人员通过帮助保护开源生态系统免受专利流氓侵害来赢取奖品。
具体说,CNCF 社区的成员通过提供证据,证明流氓专利中描述的发明在申请时并非 “新颖” 来帮助解除碰瓷威胁。证据包括开源文档、发布说明、标准或规范、产品手册、文章、博客、书籍等公开可用的信息。
- 微博 硅谷陈源博士
开源欧拉操作系统累计装机量超 1000 万套
开源欧拉 openEuler 首个 AI 原生开源操作系统 —— openEuler 24.03 LTS 版本于今年 6 月 6 日正式发布,当时累计装机量已超 680 万套。
在今日举行的操作系统大会&openEuler Summit 2024 上,华为战略部部长盖刚宣布,开源欧拉(openEuler )2024 年新增服务器操作系统市场份额突破 50%,新增装机量突破 500 万套,5 年累计装机量超过 1000 万套。
- 微博 IT之家
从今年第二季度开始,腾讯开始重新招收新员工了,当季员工数增加了 719 人,第三季度员工数增加了 3317 人。腾讯应该是增加了校招,腾讯作为互联网公司,要持续紧扣年轻消费者需求,和年轻人打成一片,不断进入大学生才不会让思维行为老化。
- 证券时报网
大模型公司们创业未半,技术主心骨们却先弃船回大厂了?
接近两年过去了,躁动的心 “死” 了一半。2024 年后半年,国内几家 AI 独角兽均进入动荡期,一批中高技术和产品骨干乃至联创团队离任,其中不少都回流大厂。
- 硅星人
掉队的腾讯大模型
然而,从去年年初至今,在文本大模型的战场上,身为 BAT 三巨头之一的腾讯,却长久地处于被动的状态。
一个明显的表现是:在 10 月国内 Web 端 AI 助手的排行榜上,腾讯的 AI 产品元宝仅排在了第 11 位,月访问量不到 200 万,远不及百度的文心一言、与阿里的通义千问。
- 科技新知
李峥:科技强者恒强?AI 可能例外
随着人工智能(AI)技术与产业的快速发展,国际学界开始越来越深入地讨论这个新兴前沿科技领域对国际政治经济领域的潜在影响。近期一种观点认为,AI 可能会终结后发国家的赶超优势,固化 “强者恒强” 的国际政治经济格局。这种观点的依据是,传统上,后发国家往往可以通过学习经验、减少试错成本、以较低成本引入先进技术等方式实现后发赶超。但在 AI 领域,这种 “后发效应” 不灵了。
- 环球时报
“二次创业” 的之江实验室 35 岁以下人员占比超 70%
为什么要打造一个计算星座?之江实验室 “良渚星座” 总体部技术副总师李超介绍,传统卫星采集遥感数据后,要先对数据进行压缩,然后在卫星经过地面站上方时才能下传数据,且数据穿过大气层时还会产生损耗。经过这样一段艰难的旅程,传送回来的可用数据不足 10%。
- 中国青年报
今日推荐
rockbite/talos
https://github.com/rockbite/talos
Talos 是一个基于节点的 VFX 编辑器,具有强大的界面并可以使用 libGDX 运行时。
开源之声
微软 Visual C++ 编译器团队架构师力挺 C++26,称其是 C++11 以来最具影响力的版本
观点 1:如果不喜欢就别用 C++,但没必要诋毁。C++ 提供了所有领域的编程,庞大和复杂的同时功能也最强最无敌,什么都是有代价的,确实 C 和 rust 再加 java 已经 go 等等可以替代 c++,但是你学一大堆,不如就研究 c++。另外 C++ 早就不是一个编程语言,已经是一个领域,一个体系,包罗万象,学习 c++ 可以触类旁通许多领域。当年 c++/cli 没通过 ISO,使得 c++ 没能在网络上也无敌,那些否定者有遏制微软的私心,却没有一种让 c++ 集大成的公心。c++ 从来不是专门编程语言,数十年发展的目标,就是无所无能。
观点 2:神经病一般一直修修补补,对于需要维护不同 c++ 标准的项目的开发者,心智负担越来越重。一个要花 5 到 10 年才能达到刚刚合格水平的语言,简直就是灾难。
观点 3:对,c++ 已经不是单个语言了,不同版本之间差异太大,一个人根本没法掌握,或者需要数年时间才能入门,得不偿失
观点 4:毁灭吧,c 艹,rust 蟹神来了,说实话现在看到 c 艹的代码真的烦
观点 5:C++ 只是个名字,每搞一个大版本就像在学习一门新的语言。理论上底层有了 C、Rust,上层有了 Java,、Go,、Python,、JS 之类,基本也能覆盖各个层面的需求,唯一不能忽视的是已有的 C++ 的代码资产
观点 6:我一直以来有个疑问,就是 java go 这种带有 gc 的语言真的就内存安全吗?我理解垃圾回收算法只能回收垃圾,但是程序员误把垃圾写成了非垃圾也就无法顺利回收了。久而久之也会造成内存泄露吧?我的理解有什么问题吗?
观点 7:c++ 转 java 的告诉你,java 内存泄露更新,只是不会 core,写了 17 年的 c++ 包括组件底层,内存泄露问题屈指可数,转了 java 以后天天排查内存泄漏
观点 8:最烦维护和修改 C++ 项目代码,后面写的人非要显的自己高大上,一定要把一些新的语言特性给用上去。单是了解 c++ 的新特性够你吃一壶,开发的本质应该是组装和创造,而不是陷在编程语言的细节啊
观点 9:新的语言特性,有好用的,有不好用的,但是有些人却是一股脑都上。也不看项目合不合适用。
活动推荐
References
https://www.oschina.net/news/320511
https://www.oschina.net/news/320498/anysphere-acquires-supermaven
https://9to5mac.com/2024/11/14/chatgtp-macos-third-party-apps/
https://phandroid.com/2024/11/13/qualcomm-focuses-on-iot-tech-with-its-newest-chips/
https://www.oschina.net/news/320545
https://weibo.com/1871474290/P0p6li8zI
https://weibo.com/1727858283/P0odkp5w1
https://weibo.com/6974787068/P0jAP8fuy
https://weibo.com/1826017320/P0o4gkg5O
https://www.stcn.com/article/detail/1413256.html
https://ishare.ifeng.com/c/s/8eWmmzwSxHh
https://baijiahao.baidu.com/s?id=1815693858878557845
https://m.huanqiu.com/article/4KG1WPlkuLe
https://t.cj.sina.com.cn/articles/view/1726918143/66eeadff02001nfoi
https://github.com/rockbite/talos
https://mp.weixin.qq.com/s/nwE7m0IAmpRFPRMpE2wucg
END
↓分享、在看与点赞~Orz