条件概率公式
P(A,B,C)=P(C∣B,A)P(B,A)=P(C∣B,A)P(B∣A)P(A)P(B,C∣A)=P(B∣A)P(C∣A,B)
基于马尔可夫链的条件概率分布
A->B->C,所以可以对上述公式进行简化
P(A,B,C)=P(C∣B,A)P(B,A)=P(C∣B)P(B∣A)P(A)P(B,C∣A)=P(B∣A)P(C∣B)
高斯分布的KL散度
KL(p,q)=logσ1σ2+2σ22σ12+(μ1−μ2)2−21
重参数化
VAE
虚线为编码器,实线为解码器。z为分布
求x的分布,转化为期望形式,然后使用Jenson不等式,只需要最大化下界
p(x)=∫zpθ(x∣z)p(z)p(x)=∫qϕ(z∣x)qϕ(z∣x)pθ(x∣z)p(z)logp(x)=logEz∼qϕ(z∣x)[qϕ(z∣x)pθ(x∣z)p(z)]logp(x)≥Ez∼qϕ(z∣x)[logqϕ(z∣x)pθ(x∣z)p(z)]
Diffusion
扩散过程
- 给定初始数据分布,不断添加高斯噪声,噪声的标准差是固定的,均值同样,是一个马尔科夫链过程。
最终的图像应该是一个各项独立的高斯分布
q(xt∣xt−1)=N(xt;1−βtxt−1,βtI)q(x1:T∣x0)=t=1∏Tq(xt∣xt−1)