全球超万亿使用量的热门数据库，首次被大模型揪出了严重漏洞

科技 2024-11-07 14:14 中国

整理 | 燕珊

谷歌的研究人员日前声称，他们首次利用大语言模型发现了一个重要漏洞。

在一篇博客文章中，谷歌表示，他们相信这是 AI agent在广泛使用的现实软件中发现此前未知的、可利用的内存安全问题的首个公开案例。具体来说，它在 SQLite 中发现了一个可被利用的堆栈缓冲区下溢漏洞。

这个漏洞在 10 月就被谷歌报告给 SQLite 开发团队，后者在同一天已经修复了它。由于漏洞在官方发布之前就被消除了，因此并没有影响到 SQLite 的用户。

1 利用大模型发现漏洞：或致程序崩溃甚至执行任意代码

这款基于大语言模型的漏洞挖掘 AI agent 名为“Big Sleep”，是谷歌的 Project Zero 和 DeepMind 合作的成果。据称，它是今年 6 月宣布的早期项目“Project Naptime”的延伸。

谷歌指出，在 8 月份的 DEFCON 安全会议上，负责创建 AI 辅助漏洞研究工具的网络安全研究人员在 SQLite 中发现了另一个问题，这激发了他们的团队去尝试看能否找到更严重的漏洞。

SQLite是一款开源的数据库引擎（拒绝背锅！39 岁失业后，我写出了一个超一万亿使用量的数据库），堆栈缓冲区下溢漏洞可能允许攻击者导致程序崩溃，甚至执行任意代码。进一步地说，崩溃或代码执行会发生在 SQLite 可执行文件（而非库）中，原因是在代码的某个地方，特殊值 -1 被意外地用作数组索引。

7476:   struct sqlite3_index_constraint {7477:      int iColumn;              /* Column constrained.  -1 for ROWID */7478:      unsigned char op;         /* Constraint operator */7479:      unsigned char usable;     /* True if this constraint is usable */7480:      int iTermOffset;          /* Used internally - xBestIndex should ignore */7481:   } *aConstraint;            /* Table of WHERE clause constraints */

这种模式会产生一个潜在的边缘情况。但函数 seriesBestIndex 未能正确处理这个边缘情况，导致在处理对 rowid 列有约束的查询时，将负索引写入栈缓冲区。在团队提供给 agent 的构建中，启用了调试断言，这个条件在第 706 行的断言中得到了检查：

619 static int seriesBestIndex(620   sqlite3_vtab *pVTab,621   sqlite3_index_info *pIdxInfo622 ){...630   int aIdx[7];           /* Constraints on start, stop, step, LIMIT, OFFSET,631                          ** and value.  aIdx[5] covers value=, value>=, and632                          ** value>,  aIdx[6] covers value<= and value< */633   const struct sqlite3_index_constraint *pConstraint;...642   for(i=0; i<pIdxInfo->nConstraint; i++, pConstraint++){643     int iCol;    /* 0 for start, 1 for stop, 2 for step */644     int iMask;   /* bitmask for those column */645     int op = pConstraint->op;...705     iCol = pConstraint->iColumn - SERIES_COLUMN_START;706     assert( iCol>=0 && iCol<=2 );707     iMask = 1 << iCol;...713     if( pConstraint->usable==0 ){714       unusableMask |=  iMask;715       continue;716     }else if( op==SQLITE_INDEX_CONSTRAINT_EQ ){717       idxNum |= iMask;718       aIdx[iCol] = i;719     }720   }

然而，在发布版本中，这个断言不存在。因此，在谷歌的测试中（这会因编译器和优化级别而异），在第 718 行的后续写入操作会破坏指向 pConstraint 的指针的最低有效 32 位，这将在下一次循环迭代中导致取消引用。这种漏洞可能会被利用。

不过，谷歌的研究人员也承认，这个漏洞的利用难度不小。

“Big Sleep”目前仍处于研究阶段，到目前为止，它使用带有已知漏洞的小型程序来评估其查找漏洞的能力。这是它的在真实世界环境中的首次实验。

在测试中，团队收集了 SQLite 代码库最近的几次提交。“在手动删除了琐碎的和仅用于文档的修改后，我们调整了 prompt，向 agent 提供了提交消息和更改的差异，并要求 agent 审查当前的代码库（在 HEAD）中是否存在可能未被修复的相关问题，”谷歌在博文中写道。

基于 Gemini 1.5 Pro 的大模型最终发现了这个漏洞。在博文中，“Big Sleep”团队还详细介绍了代理评估代码、发现漏洞、导致系统崩溃以及生成根本原因分析的步骤要点。详情可查看：https://googleprojectzero.blogspot.com/2024/06/project-naptime.html

2 AI 是模糊测试的未来？

像谷歌这样的许多公司使用一种称为“模糊测试”（Fuzzing）的过程，通过向软件提供随机或无效的数据来测试软件，以识别漏洞、触发错误或使程序崩溃。

但谷歌表示，模糊测试在“帮助防御者找到那些难以（或不可能）通过模糊测试发现的漏洞”方面做得还不够，并补充说，他们“希望 AI 能缩小这一差距”。

“我们认为这项工作具有巨大的防御潜力，”“Big Sleep”团队博客文章中宣称。“这个漏洞本身非常有趣，而且现有的 SQLite 测试基础设施（通过 OSS-Fuzz 和项目自己的基础设施）都没有发现这个问题，因此我们做了一些进一步的调查。”

值得注意的是，在 10 月，总部位于西雅图的 Protect AI 公司宣布了一款免费、开源的工具，声称可以在 Anthropic 的 Claude AI 模型的帮助下，在 Python 代码库中发现零日漏洞。这个工具名为 VulnHunter，根据其开发人员的说法，它已经在大型开源 Python 项目中发现了十多个零日漏洞。

根据谷歌的说法，这两个工具的目的不同。谷歌的一位发言人在接受《The Register》采访时强调，“我们在博客文章中的声明是，‘Big Sleep’在广泛使用的真实软件中发现了首个未知的、可被利用的内存安全问题。”“Python 的 LLM 发现的不是与内存安全相关的漏洞，而是不同类型的缺陷。”

“然而，我们想重申，这些都是高度实验性的结果，”谷歌团队写道。“‘Big Sleep’团队的立场是，Big Sleep Agent 目前针对特定目标的模糊测试工具在（发现漏洞）方面至少同样有效。”

参考链接：

https://www.theregister.com/2024/11/05/google_ai_vulnerability_hunting/

https://googleprojectzero.blogspot.com/2024/06/project-naptime.html

https://www.forbes.com/sites/daveywinder/2024/11/05/google-claims-world-first-as-ai-finds-0-day-security-vulnerability/

今日好文推荐

数据碎片化、基础设施落后，看金奖团队如何为农业生产转型提供新解法

美国大选倒计时：软件崩溃、密码泄漏，投票系统研发人员比候选人更“焦虑”？

“前端”架构真的有必要存在吗？

C/C++ 大限将至？美政府给出最强硬要求：2026 年前关键软件必须开始全面去 C

读者福利

AI 时代如何重塑团队成员能力，以赋能业务持续增长？极客时间企业版精选了来自平安证券、华润集团、东亚中国、东风岚图等 6 个行业 20+ 数字化转型标杆企业的数字化人才培养实践经验，希望能在制定 2025 年技术团队培养规划之际，为您提供经验和参考。扫码立即领取👇

http://mp.weixin.qq.com/s?__biz=MjM5MDE0Mjc4MA==&mid=2651224532&idx=1&sn=11a37a69be9ced000ef6f765595de4f1

InfoQ

为一线互联网公司核心技术人员提供优质内容。科技圈的观察者，前沿技术的传播者。

Mooncake 分离式推理架构创新与实践

Scaling Law，撞墙了吗？| 直播预告

共话 AI 与出海新趋势，技术领袖探讨未来发展之道

Apache Tomcat 11.0提供了对虚拟线程和Jakarta EE 11的支持

Chrome 被强制出售？谷歌或将抛弃 ChromeOS 全面转向 Android 系统

独家｜腾讯杰出科学家、混元大模型技术负责人之一刘威离职

StarRocks Summit 剧透 | 云原生与 AI 驱动，湖仓落地场景前瞻

ISO C++主席 Herb Sutter 离开微软，并宣布即将发布的 C++ 26 是自 C++11 以来最具影响力的版本

微软在 GitHub Universe 上为开发者推出 AI 增强工具

一朝成名，一夜破产！这家谷歌前高管创立的AI公司突然宣布倒闭，专家：这个行业不适合AI

OpenAI死对头、Claude掌舵人访谈：与Altman分道扬镳不是因为商业化、scaling law不会撞墙

QCon演讲实录 | 赵彦奇：HTTPDNS 边缘下沉，性能、成本和稳定性之间的取舍与思考

极客游学·乌镇互联网大会站启航：共话 AI 与出海新趋势

优步借助 MyRocks 差异备份显著节省了存储成本

一场泰森拳王比赛就能让上云鼻祖宕机，员工：周末不想加班修bug

腾讯发布财报，员工平均月薪超9万！Kimi的瓜太多！杨植麟惨遭前投资人提起仲裁；特朗普如何“拯救”TikTok？| Q资讯

续航超 4 小时、算力 550T，这款国产自研人形机器人让家务更轻松

Cloudflare 使用 OpenTelemetry 彻底检修日志记录管道

别慌，Scaling Laws 的末日还早！“革新版”迅速出现，多位大牛都在叫好

是否应在 Kubernetes上运行Redis？快手这样做！

Safe C++提案能复制Rust的内存安全性吗？

Grab 通过 GPT-4、Glean 和 Slack 实施了利用 LLM 的转换数据发现

“天价”ERP项目导致欧洲最大政府破产：预算涨了10倍，上线半年8000多个错误，一年税收没正常过

B 站轻量级容灾演练体系构建与业务实践

儿歌点点携手火山引擎，共创儿童成长AI伙伴

好未来：多云环境下基于 JuiceFS 建设低运维模型仓库

阿里国际推出全球首个 B2B AI 搜索引擎 Accio

通义灵码 SWE-GPT：从静态代码建模迈向软件开发过程长链推理

RAG在企业落地的难点与创新 | AICon

适应性响应方法可弹性处理软件运维中的难题

Expedia 将大型 Cassandra 集群迁移至 ScyllaDB，实现了零停机目标

微软“甩锅”神操作？服务器“安全更新”成“系统大换血”，企业懵了

应用突破还是炫技噱头：大模型能否真正驱动行业升级？

考完软考，人麻了…… | 极客时间

百度沈抖：AI 应用在 B 端率先爆发

F5 全新报告：AI 时代 API 安全面临严峻挑战

李彦宏：大模型幻觉基本消除，这是只靠想法就能赚钱时代

我们为什么不遗余力地举办 AICon？

大模型“杀死”前端？开发者如何与AI共舞 | Q推荐

生成式AI项目，数据管理的“坑”和“诀窍” | 直播预告

一句话改图！字节豆包通用图像编辑模型 SeedEdit 上线测试

一个周末重写所有代码，性能提升10倍！没有这个1000 倍工程师，就没有现在的谷歌地图

Meta元宇宙梦碎：5年烧光465亿美元，硬件高管跳槽，资本圈集体唱衰

QCon演讲实录 | 徐广治：边缘云原生操作系统的设计与思考

3000+面试题，17小时专家课：程序员的求职加速包 | 极客时间

Pinterest大幅提升时序数据库Goku存储效率和资源使用

Linus 大佬展现恐怖业务实力：只改动 21 行代码，Linux 性能狂升 2.6%

对话Steve Klabnik和Herb Sutter：Rust和C++

海柔仿真系统存储实践：混合云架构下实现高可用与极简运维

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉