预定下一个诺奖级AI？谷歌量子纠错AlphaQubit登Nature，10万次模拟实验创新里程碑

文摘 2024-11-21 18:21 山西

AI再下一城，这次直接攻进了量子计算。

今天，谷歌DeepMind团队重磅发布全新的「阿尔法」模型——AlphaQubit，一个基于Transformer构建的解码器，能以高精度识别量子计算错误。

最新研究，已经发表在Nature期刊上。

论文地址：https://www.nature.com/articles/s41586-024-08148-8

量子计算机被视为下一次科学革命的强大引擎。经典计算机往往耗费数十亿年才能解决的问题，量子计算机仅需个几小时就能破解。

有了它，人类在变革药物发现、材料设计、基础物理学等方面潜力无限。

而这一切前提是，如何能够让其可靠地运行。

相较于传统计算机，量子计算机更容易受到噪声的干扰，尤其是在大规模的应用中更为明显。

如今，大模型既然能够大范围应用在蛋白质设计、数学定理证明、芯片设计之上，在量子计算中必然也能发挥出最大的效力。

AlphaQubit便是业界在量子计算领域中，最重要的一次尝试。

它汇集了两大领域的关键知识：Google DeepMind机器学习知识和Google Quantum AI纠错专业知识。

并在多达25轮纠错的样本上完成训练，经过10万次模拟实验，成功验证了AlphaQubit优异的性能。

具体来说，AlphaQubit在处理来自Google Sycamore量子处理器的实际数据时，在distance-3和distance-5表面码（Surface code）上，超越了其他SOTA解码器。

而且，在最高distance-11情况下，AlphaQubit利用软读出和泄漏信息，在串扰和泄漏等噪声模拟数据中，保持了优越的性能。

CEO劈柴表示，「AlphaQubit利用Transformer解码量子计算机，从而在量子精度纠错方面取得了SOTA。这是AI+量子计算另一个令人兴奋的交叉点」。

另一位谷歌研究副总表示，「我们相信这将是实现实用容错量子计算的第一步」。

AlphaQubit准确纠错量子计算，意味着新系统在未来能进行大规模计算，将为更多科学突破和新的发现打开大门。

正如网友所言，「AI似乎正成为一切的答案」。

实现量子霸权？量子纠错这关必须过

量子计算机得以实现，是利用了物质在最小尺度下的独特特性，如叠加和纠缠，以远少于经典计算机的步骤解决某些类型的复杂问题。

量子比特是支撑量子计算的信息单位。它可以利用量子干涉筛选出大量可能性中的答案。

然而，量子比特的自然量子态是脆弱的，可能受到多种因素的干扰：硬件中的微观缺陷、热量、振动、电磁干扰，甚至是无处不在的宇宙射线。

一般来说，构建大规模量子计算机，需要更高效策略来纠正物理量子系统中，无法避免的错误。

因此，业界提出了使用逻辑信息冗余的量子纠错方案——量子纠错码（Quantum error-correction code）。

也就是，将多个量子比特组合成一个逻辑量子比特，并定期对其进行校验。

解码器通过使用这些校验来识别并纠正逻辑量子比特中的错误，从而保护量子信息。

其中，最有前途的策略之一是，基于表面码的量子纠错。

如下图所示，在所有具有平面连接性的编码中，表面码具有最高的已知错误容忍度。

「阿尔法」攻进量子计算，少犯30%错误

在这样的背景下，谷歌团队提出了一种一种基于循环Transformer的神经网络架构AlphaQubit。

它能够根据综合信号输入学习预测逻辑可观测量的错误。

利用一致性检查作为输入，它的任务是在实验结束时测量逻辑量子比特是否已从其准备状态翻转。

图2：AlphaQubit的纠错与训练

AlphaQubit通过两个阶段的训练——先用模拟样本进行预训练，再用有限数量的实验样本进行微调训练。具体操作如下：

首先训练模型解码来自Sycamore量子处理器内部49个量子比特的数据，该处理器是量子计算机的核心计算单元。

为了教会AlphaQubit通用的解码问题，研究人员使用量子模拟器在各种设置和错误水平下生成了数亿个示例。

这里展示了如何在distance-3的量子比特网格中，利用九个物理量子比特单元（小灰色圆圈）形成一个逻辑量子比特。在每个步骤中，还有8个量子比特执行校验（方形和半圆区域，失败时显示为蓝色和品红色，否则为灰色），这些校验结果用于通知神经网络解码器（AlphaQubit）。在实验结束时，AlphaQubit会确定发生了哪些错误

然后，通过向AlphaQubit提供来自特定Sycamore处理器的数千个实验样本，对其进行特定解码任务的微调。

在新的Sycamore数据测试中，AlphaQubit相较于之前的SOTA解码器树立了新的精度标准。

在最大规模的Sycamore实验中，AlphaQubit比张量网络方法少犯6%错误，尽管张量网络方法高度准确，但速度极慢且不切实际。

AlphaQubit还比相关匹配方法少犯30%错误。

Sycamore实验中小规模和大规模的解码准确率（distance-3为17个物理量子比特，distance-5为49个物理量子比特）

具体实验方法如下：

研究人员首先将AlphaQubit应用于谷歌的Sycamore存储实验，其中包括distance-3和distance-5的表面码上进行的X基和Z基存储实验。

3×3编码块在Sycamore芯片上的四个不同位置执行，而5×5编码块则在一个位置执行。

对于每个总轮数n ∈ {1, 3, …, 25}，进行了五万次实验，并将所得数据分为偶数和奇数子集以进行双重交叉验证。

下面描述的是在偶数集上的训练，以及在奇数集上的最终测试。

解码器性能通过每轮逻辑错误率（LER）来量化，即在每次额外的纠错轮中解码器失败的实验比例（图3a）。

解码器针对特定距离、基和位置进行训练，但可以解码任意轮次的实验。如上所述，训练分为两个阶段：预训练和微调（图2b）。

在预训练阶段，研究人员在三种不同程度与实验数据相似的模拟数据之一上进行训练。在前两种情况下，他们在从检测器错误噪声模型（DEM）中抽取的多达十亿个样本上进行预训练。

DEM要么是拟合到（偶数）检测错误事件相关性pij，要么使用基于设备校准数据（来自交叉熵基准XEB）的Pauli噪声模型导出的权重来近似硬件上发生的噪声。

在第三种情况下，作者在多达五亿个超导启发电路去极化噪声（SI1000噪声）样本上进行预训练，这不依赖于实验数据或量子设备，除了选择整体噪声规模以大致匹配实验事件密度。

在微调阶段，他们将325,000个偶数实验样本划分为训练和验证集。此过程使，作者能够在有限访问实验数据的情况下训练出高精度的解码器，同时将另一部分（奇数）保留为测试集。

AlphaQubit在distance-3时实现了 (2.901 ± 0.023) × 10⁻²的LER，在distance-5时实现了 (2.748 ± 0.015) × 10⁻²的LER（图3a，b），错误抑制比Λ = 1.056 ± 0.010。

其中，集成20个独立训练的模型在码distance-3（5）时，分别贡献了0.03 × 10⁻²（0.08 × 10⁻²）的改进。这个LER甚至低于张量网络解码器——在distance-3时为 (3.028 ± 0.023) × 10⁻²，在distance-5时为 (2.915 ± 0.016) × 10⁻²，且Λ = 1.039 ± 0.010。

而且，作者称这是迄今为止报告的该实验中最准确的解码器。

SOTA的基于MWPM的解码器，例如相关匹配（MWPM-Corr）、带有信念传播的匹配（MWPM-BP）和PyMatching（MWPM的开源实现），得到的LER高于张量网络和AlphaQubit（图3a，b）。

为了比较，研究人员还展示了Boris Varbanov提出基于LSTM的神经网络的结果36，以及谷歌自己实现的LSTM（两者均在XEB DEMs上进行预训练）。

这些在3×3上取得了良好的结果。Varbanov的基于LSTM的神经网络未能在5×5上匹敌张量网络解码器（图3b）。尽管谷歌团队的LSTM实现了这一点，但它无法扩展到更大的码距。

使用与实验数据匹配的噪声模型（pij或XEB DEMs）样本进行预训练比使用设备无关的SI1000（图3c）表现更好。

pij DEMs是为匹配基于匹配和张量网络解码器而设定的相同噪声模型。

在此先验下，AlphaQubit达到了与张量网络解码器相同的水平（在误差范围内）。

作者还注意到，即使在使用SI1000样本进行预训练且没有任何微调的情况下，AlphaQubit在码distance-5时也达到了与MWPM-BP相同的水平。

使用有限的实验数据进行微调可以减少与良好匹配的（pij和XEB）和一般性（SI1000）先验预训练的模型之间的LER差距；并将所有模型的LER提升到远超张量网络解码器（图3c）。

图3：3×3和5×5 Sycamore实验中每轮的逻辑错误率

Scaling AlphaQubit，10万轮模拟实验强泛化

为了了解AlphaQubit如何适应具有更低错误率的大型设备，谷歌使用模拟量子系统的数据对其进行了训练，这些系统最多包含241个量子比特，因为这超过了Sycamore平台的现有能力。

同样，AlphaQubit的性能优于领先的算法解码器，这表明它在未来也能应用于中型量子设备。

如下，折线图显示两个解码器的准确性随着码距的增加而提高，在更高的规模上几乎达到100%，其中 AlphaQubit表现最佳。

AlphaQubit还展示了高级功能，例如能够接受和报告输入和输出的置信水平。这些信息丰富的接口可以帮助进一步提高量子处理器的性能。

在使用包含多达25轮纠错的样本训练AlphaQubit时，它在多达100,000轮的模拟实验中保持了良好的性能，显示出其在超出训练数据的场景中的泛化能力。

不同规模/模拟实验的解码准确率（distance-3为17个量子比特，distance-11为241个量子比特），张量网络解码器因为运行太慢所以不在图中

迈向实用量子计算，预定下个诺奖？

AlphaQubit代表了使用机器学习进行量子纠错的一个重要里程碑。

它为机器学习解码领域设立了一个基准，并开辟了在真实量子硬件中使用高精度机器学习解码器的前景。

在distance-11时，训练似乎更具挑战性，并且需要增加数据量。

尽管根据团队经验，通过训练和架构改进可以显著提高数据效率，但在超过distance-11上展示高精度仍然是未来工作需要解决的重要步骤。

此外，解码器需要实现每轮1微秒的吞吐量以用于超导量子比特和1毫秒用于囚禁离子设备。提高吞吐量仍然是机器学习和基于匹配的解码器的重要目标。

虽然AlphaQubit的吞吐量慢于1微秒的目标，但可以应用一系列已建立的技术来加速，包括知识蒸馏、低精度推理和权重剪枝，以及在定制硬件中的实现。

作为一种机器学习模型，AlphaQubit最大的优势在于其从真实实验数据中学习的能力。

这使它能够利用代表I/Q噪声和泄漏的丰富输入，而无需为每个特征手动设计特定算法。这种利用可用实验信息的能力展示了机器学习在更广泛的科学问题解决中的优势。

随着量子计算朝着商业相关应用所需的潜在数百万量子比特发展，谷歌还需要找到更有效的数据方法来训练基于AI的解码器。

参考资料：

https://blog.google/technology/google-deepmind/alphaqubit-quantum-error-correction/

https://www.nature.com/articles/s41586-024-08148-8

想要了解更多资讯，请扫描下方二维码，关注机器学习研究会

转自：新智元

http://mp.weixin.qq.com/s?__biz=MzU1NTUxNTM0Mg==&mid=2247576524&idx=2&sn=2b6f0f3eb8ad54bff3b2a9f7b5112bca

机器学习研究组订阅

机器学习研究会由百度七剑客雷鸣先生创办，旨在推动AI的技术发展和产业落地。参与组织北大、清华”AI前沿与产业趋势“公开课，广泛的和高校、企业、创业、VC开展合作，自身也参与优秀AI项目的投资和孵化。

英特尔错失AI芯片浪潮，从放弃收购英伟达开始

基于MCMC的贝叶斯营销组合模型评估方法论：系统化诊断、校准及选择的理论框架

续命Scaling Law？世界模型GPT-4o让智能体超级规划，OSU华人一作

5年浴火，800余岁巴黎圣母院重生！马斯克激动转发，AI数字建模创奇迹

综述 | 时空图神经网络模型在时间序列预测和分类中的应用

宝可梦GO「偷家」李飞飞空间智能？全球最强3D地图诞生，150万亿参数解锁现实边界

预定下一个诺奖级AI？谷歌量子纠错AlphaQubit登Nature，10万次模拟实验创新里程碑

OpenAI薪酬大曝光！奥特曼身价145亿，年薪只有55万

逼真到离谱！1000个人类「克隆」进西部世界，AI相似度85%细节太炸裂

Mistral放大招！124B多模态巨无霸登场，免费版ChatGPT震撼突袭

一文解读：时序基础模型的缩放定律

OpenAI「23个黑手党」出走创业，融资近百亿！华人科学家约占1/3

10种数据预处理中的数据泄露模式解析:识别与避免策略

「谍战」开启！基建狂魔马斯克122天交付10万卡超算，对手大恐慌派间谍飞机侦查

14天速成LLM高手！大佬开源学习笔记，GitHub狂揽700星

Nature:「人类亲吻难题」彻底难倒LLM，所有大模型全部失败！LLM根本不会推理，只是工具

过程奖励模型PRM成版本答案！谷歌DeepMind全自动标注逐步骤奖励PAV，准确率提升8%

Github上的十大RAG(信息检索增强生成)框架

斯坦福伯克利重磅发现DNA Scaling Law，Evo荣登Science封面！AI设计DNA/RNA/蛋白质再突破

ChatGPT深夜两弹更新！macOS版联动三款IDE无缝编程，Windows版全量上线

RAPTOR：多模型融合+层次结构 = 检索性能提升20%，结果还更稳健

国产地表最强视频模型震惊歪果仁，官方现场摇人30s直出！视觉模型进入上下文时代

又一OpenAI研究员离职！不相信OpenAI能造福世界，AGI使命无比困难

LLM4Rec最新重磅工作：字节跳动序列推荐分层大模型HLLM

OpenAI总裁出走3月终于归来！Greg结束「最长假期」专注重大技术挑战，每周狂肝100小时代码

Transformer打破三十年数学猜想！Meta研究者用AI给出反例，算法杀手攻克数学难题

FoundTS：首个覆盖多场景的时序预测基础模型评测基准

Ilya认错，Scaling Law崩了？自曝SSI秘密技术路线取代OpenAI

AlphaFold3重磅开源，诺奖级AI颠覆世界！GitHub斩获1.8k星，本地即可部署

扩散模型失宠？端侧非自回归图像生成基础模型Meissonic登场，超越SDXL！

Scaling Law撞墙，AI圈炸锅了！OpenAI旗舰Orion被曝遭遇瓶颈，大改技术路线

陶哲轩联手60多位数学家出题，世界顶尖模型通过率仅2%！专家级数学基准，让AI再苦战数年

三种Transformer模型中的注意力机制介绍及Pytorch实现：从自注意力到因果自注意力

奥特曼专访自曝OpenAI掌握AGI密钥，2025年降临！1人1万块GPU缔造十亿独角兽

哈佛推出全新类ChatGPT癌症诊断AI，登上Nature！准确率高达96%

基于图论的时间序列数据平稳性与连通性分析：利用图形、数学和 Python 揭示时间序列数据中的隐藏模式

无人车大战打响！美国萝卜日爆8000单破纪录，中美对决已到关键转折点

川普赢了，AI圈炸了！英伟达市值突破3.6万亿， OpenAI研究员：他或将见证AGI诞生

失业小哥在父母卧室做AI应用，日入2万刀！晒账单爆火全网，AI初创价值3500万

特朗普回归，美国AI解禁！马斯克变身全球首富，硅谷科技圈颠覆在即

软体机器人领域顶尖学者齐聚清华！第九届软体机器人大会将于11月15—17日在清华举行

从今天起，ChatGPT入口就是chat.com！

「黑神话」级3A大作AI实时游戏生成！港科大、中科大等祭出最强扩散Transformer，火爆国外

英伟达3.4万亿市值稳坐全球第一！苹果12年霸主地位终结

图结构赋能语言模型：华为诺亚MILA联合提出基于图的可控数据合成提升大语言模型长逻辑链推理能力

震撼预警：满血版o1倒计时！奥特曼完整专访流出：o系列疯狂迭代，马上起飞

AI圈卷疯了！xAI、Anthropic同日上线API：Grok免费公测，Claude 3.5 Haiku价格暴涨

AGENTiGraph：一个交互式知识图谱平台驱动的基于私有数据多智能体系统 - 东京&耶鲁大学等最新研究

UCLA、MIT数学家推翻39年经典数学猜想！AI证明卡在99.99%，人类最终证伪

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉