BBDM: Image-to-image Translation with Brownian Bridge Diffusion Models
Intro & Overview
Prelinamaries: DDPMs
DDPM์ ๋ํ ๊ฐ๋ตํ ์์ฝ์ ํ๋ฉฐ ์์ํ๊ฒ ์ต๋๋ค.
DDPM์ Forward Process์ Reverse process ๊ทธ๋ฆฌ๊ณ Training Objective๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ฉ๋๋ค.
DDPM: Forward Process
โข
Forward Process๋ Data์ ๋
ธ์ด์ฆ๋ฅผ ์ ์ง์ ์ผ๋ก ๋ํด๊ฐ๋ ๊ณผ์ ์
๋๋ค.
โข
Data ์์ ์์ํฉ๋๋ค.
โข
์ต์ข
Latent variable ์ด๋ฉฐ ์ธ isotropic Gaussian distribution์
๋๋ค.
โข
์์ ๋ก ๋ณํํ๋ ๊ณผ์ ์ Markov chain์ผ๋ก ์ ์๋ฉ๋๋ค.
โข
๋ ์์ฃผ ์์ ์์.
DDPM: Reverse Process.
โข
Reverse Process๋ Latent variable ๋ก๋ถํฐ ๋ฐ์ดํฐ ๋ฅผ ์ถ๋ก ํ๋ ๊ณผ์ ์
๋๋ค.
โข
์ด๋ ๋ค์๊ณผ ๊ฐ์ Markov chain์ผ๋ก ์ ์๋ฉ๋๋ค.
DDPM: Training Objective
โข
DDPM์ Evidence Lower Bound (ELBO)๋ฅผ ์ด์ฉํ์ฌ ์ต์ ํ๋ฉ๋๋ค.
โข
: ์ ๊ฐ์ฐ์์ ๋
ธ์ด์ฆ. .
โข
: denoising model.
Conditional Diffusion.
โข
๋๋ถ๋ถ์ conditional diffusion model๋ค์ condition์ Objective์ ์ง์ ์ ์ผ๋ก ์ฃผ์
ํฉ๋๋ค.
โข
ํ์ง๋ง, ๊ฐ ์ด Objective์ ๋ช
ํํ ์ ์๋์ง ์์ผ๋ฏ๋ก ์์ฑ ๊ฒฐ๊ณผ๊ฐ condition์ ๋ถํฉํ๋์ง ๋จ์ธํ ์ ์์ต๋๋ค.
Prelinamaries: Brownian Bridge
โข
Brownian bridge ๋ชจ๋ธ์ continous-time stochastic ๋ชจ๋ธ์
๋๋ค.
โข
์ด๋ condtion์ start point์ ending point์ ์ํด ์ ํด์ง๋๋ค.
โข
์ฆ, ๋
ธ์ด์ฆ์์ ๋ฐ์ดํฐ๋ก ๋ณํ๋ ๊ธฐ์กด ๋ชจ๋ธ๊ณผ ๋ฌ๋ฆฌ ๋ฐ์ดํฐ์์ ๋ฐ์ดํฐ๋ก ๋ณํ๊ฒ ๋ฉ๋๋ค.
โข
Brownian Bridge Process๋ ๋ค์๊ณผ ๊ฐ์ด ์ ์๋ฉ๋๋ค.
โข
์์ ๊ฐ๋จํฉ๋๋ค. T์ ๋ํ t์ ๋น์จ๋ก ์ ๋ฅผ Linearํ๊ฒ ์์ด์ค๋๋ค.
โข
๋
ธ์ด์ฆ๋ ์ ๊ทน๋จ์์ ์ต์๊ฐ ๋๊ณ , ์ค๊ฐ์์ ์ต๋๊ฐ ๋ฉ๋๋ค.
Methodology
Brownian Bridge Diffusin Model ์ Brownian Bridge Process๋ฅผ ์ ์ฉํ๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
โข
์ด๋, ์ (4)์ ๋ฐ๋ผ variance๋ ์ธ๋ฐ ์ผ๋ ๊ฐ ๋ฉ๋๋ค.
โข
์ด๋ T๊ฐ ๋งค์ฐ ์ปค์ง์ ๋ฐ๋ผ ๋์ฑ ํฐ ๊ฐ์ด ๋ฉ๋๋ค.
โข
๋ฐ๋ผ์ variance๋ฅผ ๋ณด์กด (Preserving) ํ ์ ์๋๋ก ๋ค์๊ณผ ๊ฐ์ด ๋์์ธํฉ๋๋ค.
โข
์ด๋ s๋ scale factor ๋ก์จ sampling diversity๋ฅผ ์ปจํธ๋กคํฉ๋๋ค. ( by default)
Forward Process:
โข
์ ์ (5) ๋ฅผ ํตํด ์ ๊ตฌํ์ฌ ๋์
ํด์ฃผ๋ฉด ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
Reverse Process ์์ ์ถ๋ฐํด ์ ๋๋ฌํ๋ reverse process๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
โข
์ด๋, : predicted mean value of noise
: variance of noise at each step.
Objective ELBO๋ฅผ ์ฌ์ฉํฉ๋๋ค.
โข
์ฒซ ํญ์ constant๊ฐ ๋์ด KL Divergence๋ 0์ด ๋ฉ๋๋ค.
โข
๋๋ฒ์งธ ํญ์ ์ (5)์ (7) ๊ทธ๋ฆฌ๊ณ Bayesโ theorem, Markov chain property๋ฅผ ์ด์ฉํด ๋ค์๊ณผ ๊ฐ์ด ๋ํ๋
๋๋ค.
โข
์ด๋, ๊ฐ unknown์ด๋ฏ๋ก reparametrization trick์ ์ฌ์ฉํฉ๋๋ค.
โข
์ฌ๊ธฐ์ ๊ฐ ์๋ ๋
ธ์ด์ฆ ๋ฅผ ์์ธกํ๋๋ก ํ๋ฉด ๋ค์๊ณผ ๊ฐ์ Linear combindation์ด ๋ฉ๋๋ค.
โข
๋ฐ๋ผ์, ELBO (์ 10)์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
์์์ผ๋ก ๋ณด๋ ์ฝ๋๋ก ๋ณด๋ ์ฌ์ค ๋ณ๊ฑฐ ์์ต๋๋ค.
์ํ์ ๋
ธ์ด์ฆ๋ฅผ ๋ํ ํ (target) L2 ๋ก์ค๋ฅผ ๊ณ์ฐํ๋ฉด ๋์
๋๋ค.
Sampling
์ฌ์ค ํฐ ์๋ฏธ๋ ์์ต๋๋ค. ์ํ๋ฌ step = 200 ์ ๋ํด DDPM ์ํ๋ง์ ํ๊ฒ ๋ค๋ ๋ป์
๋๋ค.
Experimental Results
Conclusion
โข
๊ต์ฅํ ๊ฐ๋จํ ๋
ผ๋ฌธ์ด์ง๋ง, ๊ธฐ์กด์ Bridge Model๊ณผ ๋ค๋ฅด๊ฒ ๊ฐ๋จํ ์์๋ง์ผ๋ก DDPM์ VP ํ๋ ์์ํฌ๋ก ๋ช
๋ฃํํ๋ค๋ ์ ์์ ๋ค๋ฅธ Application์ผ๋ก ๋ฐํ์ ๋ง๋ จํ๋ค๊ณ ๋ณผ ์ ์์ต๋๋ค.
โข
์ต๊ทผ์ ๋ง์ Architectural ํ ๋
ผ๋ฌธ๋ค์ ๊ฑฐ์ง DDPM์ ๊ธฐ๋ฐ์ผ๋ก ํ๊ณ ์๋ ๊ฒ ์ฒ๋ผ์.
โข
Bridge Diffusion Model์ Condition์ ๊ฐ์
์์ด๋ Image-to-image task๋ฅผ ์ํํ ์ ์๋ค๋ ์ ์์ ๋ชจ๋ธ ๋ณต์ก๋, ํ๋ จ ์๊ฐ, ์ฐจ์ ๋ณต์ก๋์์ ํฐ ์ด๋์ด ์์ต๋๋ค. (๋
ผ๋ฌธ์๋ ์ธ๊ธ๋์ง ์์์ง๋ง ์ด๋ฌํ ์ด์ ์ด Bridge Model์ ๊ฐ์ฅ ํฐ ์ฅ์ ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค.)
โข
์ด๋ฅผ ๋ฒ ์ด์ค๋ก ํ ์ ์ ๋
ผ๋ฌธ์ด ๊ณง publish ๋ ์์ ์ด๋ ๊ธฐ๋ํด์ฃผ์๋ฉด ๊ฐ์ฌ๋๋ฆฌ๊ฒ ์ต๋๋ค.