介绍
扩散模型的基石:DDPM(Denoising Diffusion Probalistic Models)[2020]
DDPM的本质作用,就是学习训练数据的分布,产出尽可能符合训练数据分布的真实图片。
训练流程
总体来说,DDPM的训练过程分为2步
扩散模型的基石:DDPM(Denoising Diffusion Probalistic Models)[2020]
DDPM的本质作用,就是学习训练数据的分布,产出尽可能符合训练数据分布的真实图片。
总体来说,DDPM的训练过程分为2步
1 | import os |
1 | # 有 GPU 就用 GPU,没有就用 CPU |
1 | print('device', device) |
1 | FaceForensics++ dataset |
主页 - LearnOpenGL CN (learnopengl-cn.github.io)
OpenGL(英语:Open Graphics Library,译名:开放图形库或者“开放式图形库”)是用于渲染2D、3D矢量图形的跨语言、跨平台的应用程序编程接口(API)。这个接口由近350个不同的函数调用组成,用来绘制从简单的图形到比较复杂的三维景象。而另一种程序接口系统是仅用于Microsoft Windows上的Direct3D。OpenGL常用于CAD、虚拟现实、科学可视化程序和电子游戏开发。
LSTM(Long Short-Term Memory)是一种长短期记忆网络,是一种特殊的RNN(循环神经网络)。与传统的RNN相比,LSTM更加适用于处理和预测时间序列中间隔较长的重要事件。
传统的RNN结构可以看做是多个重复的神经元构成的“回路”,每个神经元都接受输入信息并产生输出,然后将输出再次作为下一个神经元的输入,依次传递下去。这种结构能够在序列数据上学习短时依赖关系,但是由于梯度消失和梯度爆炸问题,RNN在处理长序列时难以达到很好的性能。
而LSTM通过引入记忆细胞、输入门、输出门和遗忘门的概念,能够有效地解决长序列问题。
记忆细胞负责保存重要信息,输入门决定要不要将当前输入信息写入记忆细胞,遗忘门决定要不要遗忘记忆细胞中的信息,输出门决定要不要将记忆细胞的信息作为当前的输出。