Nature Communications | 扩散模型的动态机制!

文摘   2024-11-26 09:46   天津  


关注+标星 邂逅每一篇经典


投稿或寻求报道:qunfunction@163.com


01






工作速览



2024年11月17日,巴黎高等师范学校物理实验室Nature Communications 在线发表题为Dynamical regimes of diffusion models的研究论文。该工作研究了在数据维度和样本量都很大,并且得分函数被最优训练的情况下的生成性扩散模型。

使用统计物理方法,作者识别了生成性扩散过程中的三个不同的动态机制。从纯噪声开始的生成动力学,首先遇到了物种分化转变,数据的广泛结构在此过程中显现,类似于相变中的对称性破缺。随后是坍缩阶段,动力学被吸引到特定的训练点,这一机制类似于玻璃相中的凝聚过程。物种分化时间可以从数据相关矩阵的谱分析中获得,而坍缩时间与过剩熵度量相关,并揭示了扩散模型存在维度的诅咒。

这些理论发现得到了高斯混合模型的解析解的支持,并通过真实数据集上的数值实验得到了证实

02








匠心独运


由于促炎巨噬细胞向抗炎巨噬细胞的复极化受损,传统的骨组织工程材料难以在糖尿病期间恢复生理性骨重塑。


图1:通过一个二维高斯混合的例子来说明反向动力学的三个阶段。轨迹根据反向动力学结束时它们所属的类别被涂成白色和蓝色。在第一阶段,蓝色和白色的轨迹在同一束内波动,x类似于白噪声。在物种分化时间tS时,蓝色和白色轨迹的集合分开,朝它们各自类别对应的分布移动。第二阶段是生成过程构建一个类似于类别中一个元素的x(例如,插图中的海岸),而与训练集中的任何数据无关。在坍缩时间tC时,轨迹开始被它们在t=0时坍缩的数据点吸引。第三阶段对应于记忆,而在第一和第二阶段,扩散模型真正地进行了泛化。右侧和左侧的图片是从ImageNet数值实验中获得的插图(请注意在t=0时,熊猫和海岸从训练集中坍缩)。

03






卓越性能




图2:高斯混合中的物种分化。两个克隆最终落在同一个聚类中的概率ϕ(t)随t/tS函数的变化,对于不同的维度d值在固定值和σ=1的情况下。实线对应于公式(6)的评估,而点是通过采样10,000个克隆轨迹得到的。垂直(水平)虚线对应于t/tS=1(ϕ(t)=0.775)。误差条对应于三倍标准误差。

图3:高斯混合中的坍缩。过剩熵密度f_e(t)/α随时间t的变化,对于不同的维度d值,在固定n=20,000的情况下。实线是理论预测,而点显示了通过从数据集中近似熵得到的数值评估结果。垂直虚线代表了高斯混合中通过(10)给定的解析预测的坍缩时间tC。误差条对应于三倍标准误差。

图4:在真实数据集中的物种分化。ϕ(t),即两个克隆最终落在同一个类别中的概率,随t/tS函数的变化,对于几个不同的图像数据集。tS的值是使用公式(4)得到的物种分化时间的理论预测,并在表1中列出。虚线水平线表示ϕ(t)=0.775,误差条对应于三倍标准误差,实线是对实验点的线性插值。

图5:在真实数据集(ImageNet16、ImageNet32和LSUN)中的坍缩(左上)ϕC(t)的演变,即两个克隆轨迹在时间零时坍缩到训练集中同一数据点的概率。(右上)在LSUN数据集上,用n=200训练得到的4000个生成样本的最后一个变化索引μ⋆的直方图。(底部)经验过剩熵f(t)/α的演变。在所有面板中,彩色垂直虚线表示的平均值。误差条对应于三倍标准误差。

参考:

Biroli, G., Bonnaire, T., de Bortoli, V. et al. Dynamical regimes of diffusion models. Nat Commun 15, 9957 (2024). https://doi.org/10.1038/s41467-024-54281-3



关注+标星 邂逅每一篇经典


投稿或寻求报道:qunfunction@163.com




群函数
分享前沿的开源技术以及有趣的科普知识。敬请关注!
 最新文章