开源日报 | C/C++增加美国安全风险;开源的十个误解;80岁国产数据库“领航人”;LLM到底能不能进行“推理”和“计划”?

科技   2024-11-11 21:21   广东  

OSCHINA

↑点击蓝字 关注我们


欢迎阅读 OSCHINA 编辑部出品的开源日报——您探索和理解开源世界的日常指南。在这里,我们每天从宏观到微观,全面展现开源技术和文化的动态图景。

每日一更,风雨无阻。

OpenSource Daily # 2024.11.11

省流概览

- 美国政府:关键软件采用 C/C++ 会增加国家安全风险
英特尔发现一行代码可使 Linux 内核性能提高 3888.9%
开源中国新版 App 使用 uni-app 重构
OpenAI 下一代大模型 Orion 被曝性能提升有限
LLM到底能不能进行“推理”(Reasoning)和“计划”(Planning)?
用 OpenAlternative 替换你的付费 SaaS 软件
中国电信星辰语音大模型再升级:中英双语及40种方言任意混说
“我心态才 60 岁,为中国数据库再干 20 年”


今日要闻

美国政府:关键软件采用 C/C++ 会增加国家安全风险

美国网络安全和基础设施安全局 (CISA) 和联邦调查局 (FBI) 最新发布了一份《Product Security Bad Practices》指南,旨在警示软件开发商在整个产品开发过程中优先考虑安全性、规避不良实践;其中还再次提及了使用 C/C++ 等 “内存不安全” 编程语言的风险性。

文件指出,在有现成的内存安全替代语言可供替代的情况下,使用内存不安全语言(如 C 或 C++)开发服务于关键基础设施或国家控制框架的新产品线是危险的,会显着增加国家风险安全、国家经济安全、国家公共卫生和安全。

英特尔发现一行代码可使 Linux 内核性能提高 3888.9%

英特尔的 Linux 内核测试机器人报告称,主线 Linux 内核的性能提高了 3888.9%。

具体表现为,在 Intel Xeon Platinum (Cooper Lake) 测试服务器上运行的“will-it-scale.per_process_ops ”可扩展性测试用例的性能提高了 3888.9%。导致性能大幅提升的相关提交是 mm, mmap: limit THP alignment of anonymous mappings to PMD-aligned sizes

补丁信息确认它将修复之前的一些性能退步,并在特殊情况下带来一些重大提升。

开源中国新版 App 使用 uni-app 重构

开源中国 OSCHINA 全新 app 已经上架到不同应用市场,此版本 app 使用了 uni-app 重构,一套代码,覆盖了 iOS 与 Android、HarmonyOS 等多个平台。

可以在各平台应用市场搜索 “OSC 开源社区” 下载,或者直接扫码。

有任何 app 问题反馈都欢迎来动弹交流:
https://www.oschina.net/oscTweet

uni-app 是一个使用 Vue.js 开发所有前端应用的框架,开发者编写一套代码,可发布到 iOS、Android、Web(响应式)、以及各种小程序(微信 / 支付宝 / 百度 / 头条 / 飞书 / QQ / 快手 / 钉钉 / 淘宝)、快应用等多个平台。

OpenAI 下一代大模型 Orion 被曝性能提升有限

据 The Information 报道,OpenAI 即将推出的下一代大语言模型 Orion 的性能提升有限,不如前几代产品进步巨大。

据称 OpenAI 目前已经完成了 Orion 的 20% 训练工作,其表现接近 GPT-4。虽然 Orion 在语言任务中表现出色,但在编码方面表现平平且存在运行成本过高的问题。OpenAI 的员工指出,Orion 部分接受了 AI 生成的数据训练,这可能导致其性能与旧模型相似。



今日观察

社交观察

LLM 到底能不能进行 “推理”(Reasoning)和 “计划”(Planning)?

在 ICML 2024 会议上,来自 Arizona State University 的教授 Subbarao Kambhampati 给了一个名为“On the Role of Large Language Models in Planning”的短课程来详细阐述他的观点。

课程地址:https://icml.cc/media/icml-2024/Slides/35226_pmm25zL.pdf

简单而言,Subbarao 认为目前 LLM 的直接计划能力是不存在的。他们实验室做了大量的工作,认为 LLM 的诸多能力其实都是某种程度的 Hallucination,本质上没法泛化或者泛化程度很低。在相对比较乐观的一方面,Subbarao 他们提出了一个叫 LLM-Modulo 的框架,让 LLM 来进行辅助的计划,这一方面 LLM 有很大的表现空间,使用了 LLM 来进行辅助计划的任务都有不错的提升。

- 微博 洪亮劼

用 OpenAlternative 替换你的付费 SaaS 软件

查找免费开源替代品:https://openalternative.co/

这是一个用来查找日常 SaaS 软件开源替代品的网站,只需要输入软件名称,它就会返回给你开源替代品。还能通过 Star 数量、评论排序。

- 微博 小众软件

开源的十个误解,最后一条你一定同意

- 开源是新生事物
开源自古有之:书籍、音乐、绘画、影视剧和视频

- 开源是更好的商业模式
想想大部分作家、音乐人、画家、导演编剧 up 主的境遇

- 开源作者道德高尚、心怀世界、乐于助人
大多数开源项目只是为了满足作者的自身需求,他也没有义务帮助任何人

- 使用开源项目会受到它的许可证的限制
99.99% 情况下并不会,有很多合法绕过许可证的方法

- 开源商业化可以解决开源困境
开源商业化的目的和本质是商业,而不是为了拯救什么

- 选择开源软件比闭源商业软件成本更低
只能说获取源代码成本更低,但这甚至排不进决策因素的前三。

- 开源代码无法收费
那开源的书籍、音乐、绘画、影视剧怎么能收费?

- 开源的推广和获客成本更低
免费试用或有条件免费的闭源商用软件推广和获客成本一样低

- 开源项目乐于接收外部贡献
你是否乐于接受外人装饰你家?

- 开源无国界
开发者有国籍

- 微博 spaceshuttle

开源向量数据库 Qdrant 有一个很恶心的 bug

开源向量数据库 Qdrant 居然有一个很恶心的 bug,时不时会发生意外的数据丢失。最后官方确认是数据库索引实现里的 bug,好汗:http://t.cn/A6nH53wb

Bug 何其多…… 会丢数据的数据库是最可怕的了。 

- 微博 agentzh

中国电信星辰语音大模型再升级:中英双语及 40 种方言任意混说

中国电信于今年 5 月推出了具备超多方言识别能力的星辰语音大模型,构建了一座打通隔阂的 AI 之桥。

时隔不到半年,星辰语音大模型的多方言能力再次突破,不仅攻克了湛江话、宜宾话、洛阳话、烟台话等,将方言种类从 30 种提升至 40 种,并引入对英文的识别。同时,模型的参数量增加一倍,大幅提升了识别的准确率。星辰语音大模型打造了国内首个且独立通过算法和服务 “双备案” 的语音大模型,并在多个国际权威评比中斩获冠军佳绩。

论文及开源地址:https://github.com/Tele-AI/TeleSpeech-ASR

- 微博  中国电信

媒体观察

利好来了!芯片,重大突破!

武汉经开区官微发布消息,由东风汽车牵头组建的湖北省车规级芯片产业技术创新联合体发布高性能车规级 MCU 芯片 ——DF30,填补国内空白。据介绍,这是一款从设计到制造全流程国产化的车规级智能高边驱动芯片,目前已在东风汽车新能源车型上正式量产搭载。

- 澎湃新闻

数智化点燃产业转型升级新引擎

近年来,数智技术如何为各行各业发展深度赋能日渐成为政府、企业和社会关注的重点。在第七届中国企业论坛 “数智化赋能产业升级” 平行论坛上,多位与会嘉宾表示,数智技术为传统产业转型升级注入了强劲动力,需要多方探索共同助推。企业需结合自身实践,找到行之有效的数智化路径。

- 经济参考报

推动人工智能与高等教育加速融合

2024 年诺贝尔物理学奖和化学奖均授予了在人工智能领域作出杰出贡献的科学家。这些奖项的颁发,充分彰显了人工智能在科学研究领域的重要地位。高校应如何一体推进教育科技人才事业发展,推动人工智能与高等教育融合发展,提升科研体系组织效能,培养兼具跨学科知识与创新能力的复合型人才,支撑高质量创新发展的新时代需求?

- 中国教育新闻网

有多少 AI 公司,如今困在智算中心?

从算力不足,到所谓的算力 “过剩”,核心问题实际上并没有完全解决。这就意味着,动辄投资数十亿甚至过百亿的大项目,不仅没有发挥出应该有的价值,还成了这场 AI 热潮中代价最高的新难题。

- 新眸

“我心态才 60 岁,为中国数据库再干 20 年”,80 岁国产数据库“领航人”追梦不止

上世纪 80 年代,冯裕才怀着关键技术不能受制于人的念头,敲下国产数据库第一行代码;21 世纪初,56 岁的他创立我国第一个数据库公司,在激烈的市场竞争中打破国外数据库垄断;今年,80 岁的他带领团队成就了 “国产数据库第一股”……

- 极目新闻

武汉未来产业跑出多个全球首创

人形机器人、先进半导体、生物制造…… 具有显著战略性、引领性、颠覆性和不确定性的未来产业,正成为新的竞争焦点。今年,武汉端出前瞻培育未来产业的蓝图,提出要建设具有全国影响力和竞争力的未来产业发展高地。

- 长江日报



今日推荐

开源项目

opensci/piflow

https://gitee.com/opensci/piflow

πFlow 是一个简单易用,功能强大的大数据流水线系统。包含丰富的处理器组件,提供 Shell、DSL、Web 配置界面、任务调度、任务监控等功能。



开源之声

用户观点

Python 3.13「自由线程」导致整体性能下降?

  • 观点 1:要有性能要求用 python 干嘛

    • 观点 2:你说的是用户考虑的事,py 开发组可不这么想,能提高为啥不搞,能快点是点

    • 观点 3:后端服务器这种应用当然可以换成其他语言,但是像 ai 这种整个生态系统都在 Python 上的,能可用的多线程实现还是更方便一些

    • 观点 4:使用 AI 库做实验,在没有定型前肯定不会移植到 C++

  • 观点 5:猜猜为啥叫实验性功能

  • 观点 6:等等,多进程咋还快了

    • 观点 7:多进程不快那为什么还要把程序弄复杂来使用多进程?

  • 观点 8:码农高天都测过了,速度不增反降的。



活动推荐
长按识别二维码 进入投票页面


完成投票即可获得一次抽奖机会,有机会获得开源中国定制背包、定制 T 恤、定制魔方




References

https://www.oschina.net/news/319906/product-security-bad-practices

https://www.oschina.net/news/319876/intel-linux-performance

https://www.oschina.net/news/319619/osc-app-v6-uni-app

https://www.pingwest.com/w/299900

https://weibo.com/3193816967/OFHnUn5Bg

https://weibo.com/1684197391/OFElC31Kv

https://weibo.com/1741533154/OFue6aQRm

https://weibo.com/ttarticle/p/show?id=2309405099530529145019

https://weibo.com/1834459124/OFKSlyWvD

https://baijiahao.baidu.com/s?id=1815327151428185194

https://finance.eastmoney.com/a/202411113234827348.html

https://www.hubpd.com/#/detail?contentId=5188146770734067879

https://finance.sina.com.cn/tech/roll/2024-11-10/doc-incvqrui8288654.shtml

https://k.sina.com.cn/article_1720962692_v6693ce8402002pmy8.html

https://cjrb.cjn.cn/html/2024-11/11/content_151729_1495409.htm

https://gitee.com/opensci/piflow

https://mp.weixin.qq.com/s/Po4msU8tjviOlMiMny6roA


END




分享在看点赞~Orz

OSC开源社区
开源中国,只关注开源圈、技术圈的硬核内容,与嬉笑怒骂。
 最新文章