Science | 基于无反向传播训练的深度物理神经网络！

文摘 2024-09-18 13:38 中国

关注+标星，邂逅每一篇经典！

文章摘要

在深度学习领域，视觉和自然语言处理方面的最新成功归功于更大的模型，但这些模型带来了能源消耗和可扩展性问题。目前，数字深度学习模型的训练主要依赖于反向传播算法，这种算法不适合物理实现。在这项工作中，作者提出了一种简单的深度神经网络架构，通过物理局部学习（PhyLL）算法增强，该算法使得在不需要详细了解非线性物理层属性的情况下，能够对深度物理神经网络进行监督和非监督训练。在元音和图像分类实验中训练了多种基于波的物理神经网络，展示了方法的普适性。与其他硬件感知训练方案相比，作者方法通过提高训练速度、增强鲁棒性，并减少因消除系统建模需求而降低数字计算的电力消耗，显示出优势。

学术地址：

https://www.science.org/doi/10.1126/science.adi8474

代码地址：

https://github.com/MomeniAli/PhyLL

前世今生

深度学习作为一种突破性技术，取得了显著的成功（1, 2），它主要运行在传统的冯·诺依曼计算硬件上。这项技术目前面临高能耗问题，例如GPT-3的1.3吉瓦时（GWh）的电力使用（3），以及计算速度慢（4）。由于这些挑战，研究人员正在探索用于人工神经网络（ANNs）的替代物理平台，包括光学（5-9）、自旋电子学（10,11）、纳米电子设备（12-15）、光子硬件（5）和声学系统（16,17）。

目前，神经网络硬件设计主要有两种方法。第一种是通过严格的操作对操作的数学同构来设计硬件，实现训练好的数学变换，主要针对深度学习的推理阶段（18-21）。第二类，深度物理神经网络（PNNs），专注于直接训练硬件的物理变换以执行所需的计算。PNNs通过利用物理变换并消除传统的软件-硬件分离，有望实现更可扩展、能效更高、速度更快的神经网络硬件（22, 23）。

到目前为止，PNNs的训练主要依赖于反向传播（BP）（24）。然而，BP并不适用于PNNs，原因之一是BP操作在硬件中的物理实现复杂且缺乏可扩展性（25-28）。通常，PNN提议使用in silico训练，在外部计算机上使用物理系统的数字孪生进行BP计算。然而，这种方法可能会因为物理系统的不准确表示而导致潜在的模拟-现实差距（6-8, 10, 13, 14, 20, 29, 30）。此外，基于BP的物理感知训练方法（PA-BP）（22）提供了对传统in silico方法的改进，但仍然需要一个可微分的数字模型来进行反向传递。此外，PA-BP训练的PNNs在受到强烈扰动时可能面临挑战，可能导致精细调整的模型无法使用，需要从头开始重新训练。

BP的另一个重要缺点是它依赖于完全了解前向传递期间执行的计算图，以准确计算导数（23, 31-34）。当在前向传递中插入一个黑盒时，BP变得不可行。因此，PNNs的替代训练方法已被证明是有利的。例如，探索用于训练物理网络的方法之一是增强的直接反馈对齐（DFA）方法（23），该方法旨在避免需要一个可微分的数字模型。然而，这种方法只与某些物理网络兼容，其中可以分离非线性和线性层。

局部学习已经被广泛研究用于训练数字神经网络，从Hopfield模型中的Hebbian对比学习早期工作（35）到最近的生物学合理框架（31, 34, 36, 37），分块BP（38, 39）和对比表示学习（40, 41）。受这一概念的启发，并为了解决基于BP的PNN训练的限制，作者提出了一种简单且与物理兼容的PNN架构，通过物理局部学习（PhyLL）算法增强。

提出的方法能够在不需要了解非线性物理层和训练数字孪生模型的情况下，对任意PNN进行监督和非监督对比学习训练。在这种无BP的方法中，通常由数字计算机执行的标准反向传递被物理系统的额外单一前向传递所取代。这种替代可以提高基于波的PNNs在训练阶段的训练速度、功耗和内存使用，通过消除其他硬件感知框架中存在的数字孪生建模阶段带来的额外开销。

作者展示了所提出方法的鲁棒性和适应性，即使在暴露于不可预测的外部扰动的系统中也是如此。为了展示方法的普适性，作者使用三种基于波的系统进行了实验性的元音和图像分类，这些系统在底层波现象和涉及的非线性类型方面有所不同。

匠心独运

图1. 深度PNNs。(A) 一个简单且与物理兼容的深度神经网络，它使用一系列非线性物理数据变换器，并通过可训练的矩阵乘法增强，通过监督的PhyLL技术进行训练（详见补充文本，第2.1.1节，以获得更多解释）。在每一层，非线性物理数据变换器在输入和输出空间之间进行非线性映射，通过最大化正数据与随机向量x的余弦相似度，以及最小化负数据与同一向量的余弦相似度，来分离正负数据。考虑了三种物理系统，它们在底层波现象和非线性类型方面有所不同。(B) 在声学中，输入数据被编码为在腔体左侧注入的不同频率的声波的强度。声波通过包含多个刚性圆柱形扩散器和非线性膜的混沌腔体传播。变换后的波形由多个麦克风接收。(C) 在混沌微波腔中，输入数据被编码为金属混乱腔体内的可编程超表面配置。输出是从波的频谱（传递函数）中获得的。(D) 在光学设置中，输入数据被编码到空间光调制器（SLM）上，通过多模光学腔（MMOC）后，产生的光强度在电荷耦合器件（CCD）相机上测量。

卓越性能

图2. 声学-PNN。(A) 声学-PNN的拓扑结构由一个带跳过连接的两层PNN组成。每层包括一个通过可训练矩阵乘法增强的声学-PNN。(B) 实验设置的照片。NL，非线性。(C) 对比测试精度与训练周期，使用in silico（计算机模拟）、理想的BP（反向传播）和PhyLL算法进行元音识别任务。(D) 训练和测试分类精度与训练周期的关系，用于元音识别任务。(E和F) PNN在训练(E)和测试(F)集上的混淆矩阵。

图3. 微波-PNN。(A) 微波-PNN的拓扑结构由一个带跳过连接的三层PNN组成。每层包括一个通过可训练矩阵乘法增强的微波-PNN。(B) 实验设置的照片。(C) 元音识别任务的训练和测试分类精度与训练周期的关系。(D和E) PNN在训练(D)和测试(E)集上的混淆矩阵。

图4. 光学-PNN。(A) 光学-PNN的拓扑结构由一个两层PNN组成。每层包括一个通过可训练矩阵乘法增强的光学-PNN。右侧面板显示了监督和非监督对比版本输入编码的示例，以及对应的在CCD相机上的输出，用于数字Mnist数据集。(B至D) 训练和测试分类精度与训练周期的关系，分别用于元音(B)、数字(C)和时尚Mnist(D)任务。(E) PNNs的非监督版本的示意图（补充文本，第S2节）。(F) 在数字Mnist数据集上，非监督对比版本的PhyLL在训练和测试集上的分类精度与训练周期的关系。

图5. 深度PNN对抗不可预测外部扰动的鲁棒性。(A) 一个深度PNN由六层光学-PNN组成，并通过可训练的矩阵乘法增强。深度PNN在元音数据集上进行了训练，目前处于推理阶段。(B) 通过向多模光纤（MMF）的传输矩阵添加均值为m、标准差为s的高斯噪声，应用硬扰动。(C和D) 展示了PA-BP（22）(C)和提出的PhyLL方法(D)之间的比较，重点是它们在应用扰动后恢复分类精度的能力。

总结展望

由于人工神经网络（ANNs）的规模，如大型语言模型（LLMs）的空前增长，预计这种增长将持续不断，这些网络的训练和推理阶段的成本已经呈指数级增长。像PNNs这样的专用硬件有潜力大幅度降低这些成本。Anderson等人（21）最近预测，与数字电子处理器相比，对于大规模的未来变换器模型，推理时间能效优势约为8000倍。本文提出的训练方法可以作为训练这些光学LLMs的可行候选方案，可能提供显著的能效和速度优势。用光学实现大规模LLMs仍然面临一些挑战，例如当前的空间光调制器（SLM）容量限制在几百万参数——远远达不到所需的数十亿参数。然而，实现数十亿参数的光学架构和能效高的PNNs并没有根本性的障碍。

参考文献：

Momeni A, Rahmani B, Malléjac M, et al. Backpropagation-free training of deep physical neural networks[J]. Science, 2023, 382(6676): 1297-1303.

关注+标星，邂逅每一篇经典！

http://mp.weixin.qq.com/s?__biz=Mzk0MTYxOTM0MQ==&mid=2247486101&idx=1&sn=84672196304326e4ccc24a2ba43ad9f2

群函数

分享前沿的开源技术以及有趣的科普知识。敬请关注！

Science | 神经网络中的特征学习机制以及无需反向传播的机器学习模型。

Nature | 用于快速、无需标记的胶质瘤浸润检测的基础模型！

Science Advances|基于生成对抗网络的重建泛癌组织学

Science Advances|基于光学相干断层扫描（OCT）的非侵入性虚拟活检！

ECCV | 通过密集归一化的超高分辨率非配对图像到图像的转换!

CVPR2024|通过扩散模型调优增强的“SAM”

Nature Mach. Intell.|基于任务辅助的GAN来增强光学纳米显微图像分辨率！

Light | 深度学习自发荧光-谐波显微镜！

Nature Communications|使用自荧光显微镜和深度学习进行虚拟双折射成像和组织学染色！

Nature Communications|未标记尸检组织的虚拟组织学染色！

Nature Communications | 超紫外光声显微镜实现深度学习驱动的真实虚拟组织学！

Nature Communications|基于深度学习的H&E染色组织向特殊染色的转换

Nature B.M.E.|通过深度学习的紫外光声显微镜实现骨组织的无标记术中组织学检查

Light|基于深度学习的虚拟染色、分割和分类在无标记光声组织学中的应用

Cell Systems|基于弱监督深度学习的图像空间转录组学中精确的单分子点检测

Nature B.M.E. | 通过深度学习对未标记组织的自体荧光图像进行虚拟组织学染色

Nature Methods|综述-用于细胞图像分析的深度学习！

Nature Communications| 基于自监督学习亚细胞空间转录组数据分割！

Nature Communications | 用于多尺度组织成像和神经元分割的模块化框架！

Nature Methods|使用Kubernetes扩展基于深度学习的细胞图像分析

Nature Methods| Cellpose 2.0：如何训练你自己的模型？

一种用于多模态图像的细胞分割基础模型

Nature Biotech.|使用大规模数据标注和深度学习实现组织图像的全细胞分割！

Science |诺奖获得者06年经典之作-使用神经网络降低数据的维度！

ECCV | ActionVOS：将动作作为提示进行视频对象分割!

超越自适应SAM：通过自动提示实现端到端的超声图像分割！

CVPR | 端到端多模态Transformer视频对象分割！

ECCV 2024 | AI的物理世界，在音视频场景中参考并分割对象Ref-AVS

Nat.Biomed.Eng. | 用于临床血管成像的快速全光学3D光声扫描仪。

Nature Communications | 高性能的深度脉冲神经网络！

刚刚，2024年诺贝尔化学奖同样也授予AI科学家！

nature | 通用医学人工智能的基础模型！

刚刚，诺贝尔物理学奖颁给研究神经网络的科学家！

NeurIPS 2024 | 何恺明老师新作！通过异构预训练的变换器扩展本体感觉-视觉学习

Nature Communications |纵向深度神经网络用于评估大型开放基准上的转移性脑癌！

基于大型视觉和语言模型的提示引导病理分割PFPs

SAM-Adapter：适应性能低下场景中的任何片段适配！

CVPR2024 | 处理扩散模型中时间间隔端点的奇异性!

CVPR2024 | 面向大图像生成的学习表示引导扩散模型！

Nature Communications|基于少量样本学习的蛋白质语言预测模型！

Nature Communications|基于临床-组织学-基因组的肾细胞癌多分类器系统！

Science Advances | 通过受激拉曼CycleGAN模型对新鲜脑组织进行虚拟病理染色!

Nature Communications | 基于预训练多模态大模型的皮肤病诊断SkinGPT-4！

Nature | 癌症诊断和预后预测的通用病理基础模型！

Nature Communications | 基于可解释图神经网络的癌症基因分析！

Nature Communications | 基于去噪超分辨率网络的蛋白质组学细胞分割与聚类！

Science | 基于无反向传播训练的深度物理神经网络！

Nature Communications|基于组织病理学的临床试验中患者预筛查深度学习算法！

Nature Rev. Cancer | 基于人工智能的癌症研究人员指导综述！

分类

时事

民生

政务

教育

文化

科技

财富

体娱

健康

情感

旅行

百科

职场

楼市

企业

乐活

学术

汽车

时尚

创业

美食

幽默

美体

文摘

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉