首页时事民生政务教育文化科技财富体娱健康情感

旅行百科职场楼市企业乐活学术汽车时尚创业美食幽默美体文摘

扩散模型是什么？又是如何工作的？

文摘教育 2024-01-06 16:09 湖南

点击上方蓝字

关注Anber

人工智能正在不断发展，并被用来解决困难和复杂的问题。而图像生成是人工智能模型面临的一个巨大挑战。

GANs、VAEs和Flow Models虽然效果不错，但很难生成高分辨率、高保真的图像。

但是扩散模型却非常擅长生成各种质量的高分辨率图像，且精度很高。现在，它们正处于生成式AI（GenAI）的革命前沿。

像GLIDE、OpenAI的DALL.E-3、谷歌的Imagen和Stable Diffusion等模型都是一些流行的扩散模型，接下来让我们了解一下扩散模型。

什么是扩散模型？

扩散模型是一类生成式 AI 模型，可生成不同质量的高分辨率图像。

它们的工作原理是在正向扩散过程中逐渐将高斯噪声添加到原始数据中，然后在反向扩散过程中学习去除噪声。

它们是隐变量模型，指的是隐藏的连续特征空间，看起来类似于VAE（变分自动编码器），并且大致基于非平衡热力学。

扩散模型

扩散模型论文分享

本文是对扩散模型的非常简短的介绍，对扩散模型及其工作原理进行了基本的讲解。

如果大家想详细了解扩散模型，建议大家自行阅读扩散模型论文。

为了避免添加人数过多出现频繁，大家可以随便添加一个小助手，让她发给你

现有模型的问题

现有的深度学习模型，如GANs和VAEs，在生成图像方面表现良好，但它们也面临一些问题。

比如GANs的对抗训练性质，它们仍然在训练不稳定和生成多样化的图像问题上有诸多难题。VAEs中的替代损失也会引发问题。

让我们详细了解扩散模型

去噪扩散建模分为两步：

前向扩散过程 — 前向扩散过程是扩散步骤的马尔可夫链，在这个过程中，我们缓慢而随机地向原始数据添加噪声。
反向扩散过程 — 反向扩散过程尝试反向扩散过程，以从噪声中生成原始数据。

正向扩散过程

在正向扩散过程中，我们通过一系列T步，缓慢而逐渐地向输入图像x₀添加高斯噪声。

我们从从真实数据分布q(x)中采样一个数据点x₀开始，然后向xₜ₋₁添加一些方差为βₜ的高斯噪声，产生一个新的潜在变量xₜ，其分布为q(xₜ∣xₜ₋₁)。

正向扩散过程

正向扩散过程

q(xₜ∣xₜ₋₁)由均值μ定义

∑=FYI,I是单位矩阵，并且总是方差的对角矩阵。

当T接近∞时，x_{T}成为各向同性的高斯分布。∑ₜβₜIΣ。

重新参数化技巧

应用 q（xt | xt₋₁）并计算任意时间步长的 xt 对于大量步骤来说可能会非常昂贵。重新参数化技巧解决了这个问题，并允许我们从以下分布中以任意时间步长对 xt 进行采样：

参数化后技巧

逆向扩散过程

这是通过逆向应用正向传播中的噪声过程来训练神经网络以恢复原始数据的过程。估计 q(xt−1∣xt) 是困难的，因为它可能需要整个数据集。

这就是为什么可以使用参数化模型 pθ（神经网络）来学习参数的原因。对于足够小的 βt，它将是一个高斯分布，并且可以通过参数化均值和方差来获得。

反向扩散过程

反向扩散过程

扩散模型论文分享

本文是对扩散模型的非常简短的介绍，对扩散模型及其工作原理进行了基本的讲解。

如果大家想详细了解扩散模型，建议大家自行阅读扩散模型论文。

为了避免添加人数过多出现频繁，大家可以随便添加一个小助手，让她发给你

— 完 —

如果喜欢本篇的内容记得点点再看，并把他转发到你的朋友圈。请永远不要停止学习，这是你武装自己对抗这个世界最有力的武器！

认真传播知识的科研人

关注公众号

获取人工智能技能+干货

http://mp.weixin.qq.com/s?__biz=MzkzMjQyMzAxMw==&mid=2247495615&idx=1&sn=45463dec1d327b4301d72fc5f65511a1

一个认真传播知识的技术人，日常分享人工智能学习方法+技术文章，希望大家喜欢。

最新文章

这绝对是国内学习PyTorch深度学习的顶尖之作！它让我对各种神经网络、建模技巧及调参方法有了透彻的理解！

这本关于Transformer模型的书写的太棒了！它无疑是迄今为止最全面、最系统地解析Transformer模型的著作！！

熬了5个通宵看完，酣畅淋漓！是我见过把人工智能数学基础知识讲得最好的！

这本书让我轻松掌握了深度学习的数学基础知识！！不是，写这么好干嘛？？？难怪7000多条评价都有99.9%的好评率！

读研读博都得自救！20多篇SCI斯坦福博士心得：科研入门中文教程，帮你避开要踩几年的坑，养成完善的科研习惯！

KAN卷积神经网络来了！下一轮热点来袭？

天天炸圈的ChatGPT到底是啥？又为什么有效？

这应该是每个学金融人工智能的人都应该看的综述！

省时易懂！弄懂机器学习深度学习概念=30个问答题！

图机器学习封神之作！包含丰富的代码示例、多种图形数据实施的机器学习技术和算法

比啃书看视频更容易入门的深度学习神级网站！超全面！

登上Nature！这次直接分割一切医学图像！基于sam的医学图像分割模型

降维打击！私有数据集是真好发论文啊！一个神级自动化数据标注工具！

深度学习发论文的蓝海领域！关于深度学习机器学习黑盒模型可解释性最强教程书！

50岁发表了400多篇论文的印度大佬写的机器学习数学书是真强啊！

代码水平低，但是要用pytorch做深度学习应该怎么学？

又一个好出论文的方向-深度生成建模！

这应该是关于深度学习神经网络、感知机最通俗的解释了

新手必看！把CNN卷积神经网络讲透！

扩散模型是什么？又是如何工作的？

5本霸榜机器学习深度学习的中文教程书！（附PDF）

2023深度学习初学者必读的8大热门综述推荐（附PDF）

蓄势17年！机器学习必读书籍PRML作者再出新书！直接把深度学习基础、架构、技术讲透！

用一本有代码注释的书解决你几乎所有机器学习问题！

终于让我找到了！嵌入式机器学习唯一一本标准教科书！由 TensorFlow 作者撰写

太..强了！用数据增强轻松解决数据单一、数据量不够、数据集太小的问题！

李飞飞11月新书《我看到的世界》人工智能黎明时的好奇心、探索和发现

【读研人必备】Papers with Code使用指南

真没想到pytorch这么容易学！

从机器学习的历史到未来、应用方法、场景

把数学代入菜市场会是什么样的？

代码有救啦！所有代码逐行解释，放养党起飞

机器学习十大算法的优缺点！

解决（几乎所有）机器学习问题！中文版！！！

图神经网络的底层数学原理总结

掌握这本SCI写作书上的技巧，让你论文无忧！

终于有人把矩阵说清楚了，万字长文解读线性代数中的矩阵

一本书！解决（几乎所有）机器学习问题

21个知识点让你快速上手机器学习

刚读硕士，怎么快速搭建一个神经网络？

神经网络背后的数学原理是什么？

一个好出论文的点：医学＋AI

中国博士把整个 CNN 可视化了！！！

清华最新192页 AIGC发展研究报告PDF

深度学习需要经常复现代码吗？（附带人工智能领域200篇可复现论文）

机器学习模型选择困难者福音！！！

研一没方向？导师放养？论文不知道怎么找？图像分割不可错过的35篇可复现论文【包含22-23年最新论文】

CodeGeeX：Tab 一下，代码生成！

什么是深度学习？从图灵测试谈到ChatGPT

SAM 史上首个图像分割基础模型，cv将迎来GPT-3时刻？

分类

原创标签

时事社会财经军事教育体育科技汽车科学房产搞笑综艺明星音乐动漫游戏时尚健康旅游美食生活摄影宠物职场育儿情感小说曲艺文化历史三农文学娱乐电影视频图片新闻宗教电视剧纪录片广告创意壁纸头像心灵鸡汤星座命理教育培训艺术文化金融财经健康医疗美妆时尚餐饮美食母婴育儿社会新闻工业农业时事政治星座占卜幽默笑话独立短篇连载作品文化历史科技互联网

发布位置

广东北京山东江苏河南浙江山西福建河北上海四川陕西湖南安徽湖北内蒙古江西云南广西甘肃辽宁黑龙江贵州新疆重庆吉林天津海南青海宁夏西藏香港澳门台湾美国加拿大澳大利亚日本新加坡英国西班牙新西兰韩国泰国法国德国意大利缅甸菲律宾马来西亚越南荷兰柬埔寨俄罗斯巴西智利卢森堡芬兰瑞典比利时瑞士土耳其斐济挪威朝鲜尼日利亚阿根廷匈牙利爱尔兰印度老挝葡萄牙乌克兰印度尼西亚哈萨克斯坦塔吉克斯坦希腊南非蒙古奥地利肯尼亚加纳丹麦津巴布韦埃及坦桑尼亚捷克阿联酋安哥拉