Discriminative vs generative models
Discriminative ๋ชจ๋ธ์ ๋ฐ์ดํฐ ์ธ์คํด์ค๋ค ๊ฐ์ ๊ฒฝ๊ณ๋ฅผ ํ์ตํ๋๋ฐ ์ค์ ์ ๋๋ค.
์ด๋ ํน์ง X๊ฐ ์ฃผ์ด์ก์ ๋, ๋ ์ด๋ธ y์ ํ๋ฅ P(y|X)์ ์ง์ ๋ชจ๋ธ๋งํ์ฌ ๊ฒฐ์ ๊ฒฝ๊ณ๋ฅผ ์ฐพ๋ ๊ฒ์ด๋ค.
์ด ๋ชจ๋ธ๋ค์ ์์ธก ์ค๋ฅ๋ฅผ ์ธก์ ํ๋ ๋น์ฉ ํจ์๋ฅผ ์ต์ ํํ์ฌ ํ๋ จ๋๊ณ , ํ๋ จ ๊ณผ์ ์์ ๋ชจ๋ธ ํ๋ผ๋ฏธํฐ๋ฅผ ์กฐ์ ํ์ฌ ์ค๋ฅ๋ฅผ ์ต์ํํ๋ค.
ex) ๋ก์ง์คํฑ ํ๊ท, CNN, RNN
Generative model ์ ์๋ก์ด ๋ฐ์ดํฐ ์ธ์คํด์ค๋ฅผ ์์ฑํ ์ ์๋ค. ์์ฑ ๋ชจ๋ธ์ ํน์ง๊ณผ ๋ ์ด๋ธ์ ๊ฒฐํฉ ํ๋ฅ ๋ถํฌ
P(X,y)๋ฅผ ํ์ตํ๋๋ฐ ์ค์ ์ ๋๋ค.
โ๊ฒฐํฉ ํ๋ฅ ๋ถํฌ ๐(๐,๐ฆ)
ํน์ง ๐์ ๋ ์ด๋ธ ๐ฆ ์ ๊ฒฐํฉ ํ๋ฅ ๋ถํฌ ๐(๐,๐ฆ)๋ ์ฃผ์ด์ง ๋ฐ์ดํฐ์์ ํน์ง๊ณผ ๋ ์ด๋ธ์ด ๋์์ ๋ฐ์ํ ํ๋ฅ ์ ๋ํ๋ด๋ ๋ถํฌ์ด๋ค. ์ด๋ฅผ ํตํด ์์ฑ ๋ชจ๋ธ์ ๋ฐ์ดํฐ๋ฅผ ๋ ์ ์ดํดํ๊ณ , ์๋ก์ด ๋ฐ์ดํฐ๋ฅผ ์์ฑํ ์ ์๋ค. ๊ฒฐํฉ ํ๋ฅ ๋ถํฌ๋ฅผ ์ดํดํ๋ ๊ฒ์ ๋ ๊ฐ์ง ํ๋ฅ , ์ฆ ์กฐ๊ฑด๋ถ ํ๋ฅ ๐(๐ฆโฃ๐)์ ์ฌ์ ํ๋ฅ ๐(๐)์ ํจ๊ป ๊ณ ๋ คํ๋ ๊ฒ์ ์๋ฏธํ๋ค.
P(X,y)=P(yโฃX)P(X)
P(yโฃX)๋ ์ฃผ์ด์ง ํน์ง ๐X์ ๋ํด ๋ ์ด๋ธ y๊ฐ ๋ํ๋ ์กฐ๊ฑด๋ถ ํ๋ฅ ์ด๋ค.P(X)๋ ํน์ง X์ ์ฌ์ ํ๋ฅ ์ด๋ค.
์ด ๋ถํด๋ฅผ ํตํด ๊ฒฐํฉ ํ๋ฅ ๋ถํฌ๋ ํน์ง๊ณผ ๋ ์ด๋ธ ๊ฐ์ ๊ด๊ณ๋ฅผ ํฌ์ฐฉํ ์ ์๋ค. ์๋ฅผ ๋ค์ด, ์ด๋ฏธ์ง ๋ถ๋ฅ ๋ฌธ์ ์์ X๋ ์ด๋ฏธ์ง์ ํฝ์ ๊ฐ๋ค์ด๊ณ y๋ ์ด๋ฏธ์ง์ ๋ํ ๋ ์ด๋ธ(์: ๊ณ ์์ด, ๊ฐ ๋ฑ)์ด๋ค. P(X,y)๋ฅผ ๋ชจ๋ธ๋งํ๋ฉด ์ฃผ์ด์ง ์ด๋ฏธ์ง X๊ฐ ์์ ๋, ๊ทธ ์ด๋ฏธ์ง๊ฐ ํน์ ๋ ์ด๋ธ y๋ฅผ ๊ฐ์ง ํ๋ฅ ์ ์ดํดํ๋ ๊ฒ๊ณผ ๋๋ถ์ด, ์ด๋ค ์ด๋ฏธ์ง๊ฐ ๋ฑ์ฅํ ๊ฐ๋ฅ์ฑ์ด ์๋์ง๋ฅผ ๋ชจ๋ ํ์ตํ๊ฒ ๋๋ค.
์ด๋ฅผ ํตํด ๋ชจ๋ธ์ ๋จ์ํ ๋ ์ด๋ธ์ ์์ธกํ๋ ๊ฒ๋ฟ๋ง ์๋๋ผ, ์๋ก์ด ๋ฐ์ดํฐ ์ธ์คํด์ค๋ฅผ ์์ฑํ ์ ์๋ค.
Trilemma of Generative Models
์์ฑ ๋ชจ๋ธ์ ์ผ์ค ๋๋ ๋ง(Trilemma of Generative Models)๋ ์์ฑ ๋ชจ๋ธ์ด ๋์์ ์ธ ๊ฐ์ง ์ค์ํ ํน์ฑ์ ๋ชจ๋ ๋ง์กฑ์ํค๊ธฐ ์ด๋ ต๋ค๋ ๋ฌธ์ ๋ฅผ ์๋ฏธํ๋ค. ์ธ๊ฐ์ง ํน์ฑ์ ๋ค์๊ณผ ๊ฐ๋ค.
1. ์ํ์ ์ง : ์์ฑ๋ ์ํ์ด ์ผ๋ง๋ ์ค์ ๋ฐ์ดํฐ์ ์ ์ฌํ๊ณ ์์ฐ์ค๋ฌ์ด์ง
2. ๋ค์์ฑ : ์์ฑ๋ ์ํ์ด ์ผ๋ง๋ ๋ค์ํ์ง. ๋์ ๋ค์์ฑ์ ์์ฑ๋ ์ํ๋ค์ด ๋ฐ์ดํฐ์ ์ ์ฒด ๋ถํฌ๋ฅผ ์ ๋ฐ์ํ๊ณ , ์๋ก ๋ค๋ฅด๋ฉฐ, ๋ค์ํ ํน์ง๋ค์ ํฌํจํ๊ณ ์์์ ์๋ฏธํ๋ค.
3. ์ฐ์ฐ ํจ์จ์ฑ : ๋ชจ๋ธ์ ํ์ต์ํค๊ณ ์ํ์ ์์ฑํ๋๋ฐ ํ์ํ ์ฐ์ฐ ์์(์๊ฐ, ๋ฉ๋ชจ๋ฆฌ)์ ํจ์จ์ฑ
๊ณ ํ์ง์ ์ํ์ ์์ฑํ๋ ๋ชจ๋ธ์ ์ข ์ข ๊ณผ์ ํฉ ๋ฌธ์ ๋ก ์ธํด ์ํ์ ๋ค์์ฑ์ด ๋จ์ด์ง ์ ์๋ค.
๋์ ํ์ง์ ์ํ์ ์์ฑํ๋ ค๋ฉด ๋ณต์กํ ๋ชจ๋ธ ๊ตฌ์กฐ์ ๋ง์ ์ฐ์ฐ ์์์ด ํ์ํ๋ฐ, ์ด๋ ์ฐ์ฐ ํจ์จ์ฑ์ ์ ํ์ํจ๋ค.
๋ค์ํ ์ํ์ ์์ฑํ๋ ๋ชจ๋ธ์ ์ ์ฒด ๋ฐ์ดํฐ ๋ถํฌ๋ฅผ ์ ํ์ตํด์ผํ๋ฏ๋ก, ๋ ๋ง์ ๋ฐ์ดํฐ์ ๋ณต์กํ ํ์ต๊ณผ์ ์ด ํ์ํ๋ค. ์ฐ์ฐ ์์์ ๋ง์ด ์๋ชจํ๊ฒ ๋์ด ํจ์จ์ฑ์ ๋จ์ด๋จ๋ฆฐ๋ค.
GAN ์ ๊ณ ํ์ง์ ์ํ์ ์์ฑํ๋๋ฐ์๋ ํ์ํ์ง๋ง, ๋ชจ๋ ๋ถ๊ดด(mode collapse) ๋ฌธ์ ๋ก ์ธํด ๋ค์์ฑ์ด ๋จ์ด์ง ์ ์๋ค.
VAE ๋ ๋น๊ต์ ์์ ์ ์ผ๋ก ํ๋ จ๋๋ฉฐ ๋ค์ํ ์ํ์ ์์ฑํ ์ ์์ง๋ง, ์ํ์ ํ์ง์ด GAN์ ๋นํด ๋จ์ด์ง ์ ์๋ค.
Diffusion model ์ ๋งค์ฐ ๋์ ํ์ง์ ์ํ์ ์์ฑํ๊ณ ๋ฐ์ดํฐ์ ์ ์ฒด ๋ถํฌ๋ฅผ ์ ํ์ตํ์ฌ ๋ค์ํ ์ํ์ ์์ฑํ์ง๋ง,
๋ฐ์ดํฐ๋ฅผ ์ ์ง์ ์ผ๋ก ๋ณํํ๋ ์ฌ๋ฌ ๋จ๊ณ๋ฅผ ํ์๋กํ๊ธฐ ๋๋ฌธ์ ๊ณ์ฐ ๋น์ฉ์ด ๋งค์ฐ ๋๋ค.
Key Idea of GAN
Police-Criminal Analogy
- Criminal ( Generator ) : ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์์ฑํ์ฌ Police ๋ฅผ ์์ด๋ ์ญํ ์ ํ๋ค. ์ง์ง ๋ฐ์ดํฐ์ ๊ตฌ๋ณ๋์ง ์๋ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๊ฒ์ด ๋ชฉํ์ด๋ค. ์ด๊ธฐ์๋ ๋ฒ์ฃ์๊ฐ ๋ง๋ ๊ฐ์ง ๋ฐ์ดํฐ๋ ๋งค์ฐ Low-quality ์ด๊ณ , ๋ฐ๋ผ์ Police ์ ์ํด ์ฝ๊ฒ ์กํ๋ค. ํ์ง๋ง ์๊ฐ์ด ์ง๋จ์ ๋ฐ๋ผ ๋ฒ์ฃ์๋ Police๋ฅผ ์์ด๊ธฐ ์ํด ์ ์ ๋ ์ ๊ตํ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ ๋ฒ์ ๋ฐฐ์ฐ๊ฒ ๋๋ค.
- Police : ๋ฐ์ดํฐ๊ฐ ์ง์ง์ธ์ง ๊ฐ์ง์ธ์ง๋ฅผ ๊ตฌ๋ถํ๋ ์ญํ ์ ํ๋ค. ์ง์ง ๋ฐ์ดํฐ์ ๋ฒ์ฃ์๊ฐ ๋ง๋ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์ ํํ๊ฒ ๊ตฌ๋ณํ๋ ๊ฒ์ด ๋ชฉํ์ด๋ค. ์ฒ์์๋ ๊ฒฝ์ฐฐ๋ ์์ง ์ด๋ณด๋ผ์ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์ ๊ตฌ๋ถํ์ง ๋ชปํ ์ ์์ง๋ง, ์ ์ ๋ ๊ฒฝํ์ด ์์ด๋ฉด์ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์ ์๋ณํ๊ฒ ๋๋ค.
Generative Adversarial Network
1. ์ด๊ธฐ ๋จ๊ณ
- ์์ฑ์๋ ๋ฌด์์ ๋ ธ์ด์ฆ๋ฅผ ์ ๋ ฅ ๋ฐ์ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋ค.
- ํ๋ณ์๋ ์ง์ง ๋ฐ์ดํฐ์ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ๊ตฌ๋ณํ๋ ๋ฒ์ ํ์ตํ๋ค.
2. ๊ฒฝ์์ ํ์ต
- ์์ฑ์๋ ํ๋ณ์๋ฅผ ์์ด๊ธฐ ์ํด ์ ์ ๋ ์ง์ง ๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๋๋ก ํ์ตํ๋ค.
- ํ๋ณ์๋ ์์ฑ์๊ฐ ๋ง๋ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ๋ ์ ๊ตฌ๋ณํ๋๋ก ํ์ตํ๋ค.
3. ๊ท ํ ์ํ
- ์ด์์ ์ผ๋ก, ํ์ต์ด ์ถฉ๋ถํ ์งํ๋๋ฉด ์์ฑ์๋ ์ง์ง ๋ฐ์ดํฐ์ ๊ฑฐ์ ๊ตฌ๋ณ๋์ง ์๋ ๊ณ ํ์ง์ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์์ฑํ๊ฒ ๋๊ณ , ํ๋ณ์๋ ์ง์ง์ ๊ฐ์ง๋ฅผ 50:50์ ํ๋ฅ ๋ก ๊ตฌ๋ถํ๊ฒ ๋๋ค.
- ์ด ์ํ๊ฐ ๋๋ฉด, ์์ฑ์๊ฐ ๋ง๋ค์ด๋ธ ๊ฐ์ง ๋ฐ์ดํฐ๋ ์ง์ง ๋ฐ์ดํฐ์ ๊ฑฐ์ ๋์ผํ ํ์ง์ ๊ฐ์ง๊ฒ ๋๋ค.
์์ฑ์์ ํ๋ณ์๊ฐ ์๋ก ๊ฒฝ์ํ๋ฉฐ ์ํธ ๋ฐ์ ํ๋ ๊ณผ์ ์ ํตํด, GAN์ ๋งค์ฐ ์ ๊ตํ๊ณ ํ์ค์ ์ธ ๋ฐ์ดํฐ๋ฅผ ์์ฑํ ์ ์๊ฒ ๋๋ค. ์ด ๊ฒฝ์์ ํ์ต ๊ณผ์ ์ด GAN์ ํต์ฌ ์์ด๋์ด์ด๋ค.
์์
1. ์์ฑ์ G
- ์ ๋ ฅ์ผ๋ก ์ ์ฌ๊ณต๊ฐ(latent space) z์์ ์ํ๋งํ ๋ฒกํฐ z~pz(Z)๋ฅผ ๋ฐ๋๋ค.
- ์ด๋ฅผ ํตํด ๊ฐ์ง ๋ฐ์ดํฐ ์ํ G(z)๋ฅผ ์์ฑํ๋ค.
2. ํ๋ณ์ D
- ๋ฐ์ดํฐ ์ํ x๊ฐ ์ง์ง ๋ฐ์ดํฐ์ธ์ง Pdata(x)์์ ์ํ๋งํ ๊ฒ์ธ์ง, ์๋๋ฉด ๊ฐ์ง ๋ฐ์ดํฐ G(z)์ธ์ง ๊ตฌ๋ณํ๋ ค๊ณ ํ๋ค.
- D(x)๋ ์ ๋ ฅ ๋ฐ์ดํฐ x๊ฐ ์ง์ง์ผ ํ๋ฅ ์ ์ถ๋ ฅํ๋ค.
๋ชฉ์ ํจ์ V(D,G)
์ฒซ๋ฒ์งธ ๊ธฐ๋๊ฐ
- ์ง์ง ๋ฐ์ดํฐ ์ํ x ์ ๋ํด ํ๋ณ์๊ฐ ์ฌ๋ฐ๋ฅด๊ฒ ์ง์ง๋ผ๊ณ ํ๋จํ๊ธฐ๋ฅผ ๊ธฐ๋ํ๋ค.
Q. ์ง์ง ๋ฐ์ดํฐ ์ํ x๋ฅผ ๊ฐ์ง๋ผ๊ณ ํ๋ณํ ํ๋ฅ ๋ ์๋?
- logD(x) ๋ ํ๋ณ์๊ฐ ์ง์ง ๋ฐ์ดํฐ์ ๋ํด ์ถ๋ ฅํ๋ ํ๋ฅ ์ ๋ก๊ทธ ๊ฐ์ด๋ค.
๋๋ฒ์งธ ๊ธฐ๋๊ฐ
- ์์ฑ์๊ฐ ๋ง๋ ๊ฐ์ง ๋ฐ์ดํฐ G(z)์ ๋ํด ํ๋ณ์๊ฐ ์ฌ๋ฐ๋ฅด๊ฒ ๊ฐ์ง๋ผ๊ณ ํ๋จํ๊ธฐ๋ฅผ ๊ธฐ๋ํ๋ค.
( D(G(z))๋ G(z) ๊ฐ ์ง์ง๋ผ๊ณ ํ๋จ๋ ํ๋ฅ ์ ์ถ๋ ฅํ๋ฏ๋ก, 1-D((G(z)) ๋ G(z)๊ฐ ๊ฐ์ง๋ผ๊ณ ํ๋จ๋ ํ๋ฅ ์ ์๋ฏธํ๋ค. )
- log(1−D(G(z))๋ ํ๋ณ์๊ฐ ๊ฐ์ง ๋ฐ์ดํฐ์ ๋ํด ์ถ๋ ฅํ๋ ํ๋ฅ ์ ๋ก๊ทธ๊ฐ์ด๋ค.
โlog ๋ฅผ ์ฌ์ฉํ๋ ์ด์
์ด๊ธฐ ํ์ต ๋จ๊ณ์์ D(G(z)) ๋ ๋งค์ฐ ๋ฎ์ ์ ์์ด, 1-D((G(z)) ๊ฐ ๊ฑฐ์ 1์ ๊ฐ๊น์์ง๋ค. ๋ง์ฝ 1-D((G(z))๋ฅผ ์ง์ ์ต์ํํ๋ ค๊ณ ํ๋ฉด, ์ด๊ธฐ ํ์ต ๋จ๊ณ์์ ์์ฑ์์๊ฒ ๋์์ค๋ ๊ทธ๋๋์ธํธ๊ฐ ๋งค์ฐ ์์์ง๋ค. ์ด๋ก ์ธํด ์์ฑ์์ ํ์ต์ด ๋งค์ฐ ๋๋ฆฌ๊ฒ ์งํ๋๊ฑฐ๋ ์์ ๋ฉ์ถ ์ ์๋ค. ๋ฐ๋ฉด log๋ฅผ ์ฌ์ฉํ๋ฉด D(G(z))๊ฐ ๋งค์ฐ ์์๋ ๊ทธ๋๋์ธํธ๊ฐ ์ ์ ํ ํฌ๊ธฐ๋ฅผ ์ ์งํ์ฌ ํ์ต์ด ์ํํ๊ฒ ์งํ๋๋ค.
์๋ฅผ ๋ค์ด D(G(z))๊ฐ 0์ ๊ฐ๊น์ธ ๋, logโก(1−๐ท(๐บ(๐ง)) ๋ ํฐ ์์ ๊ฐ์ ๊ฐ์ง๋ฉฐ, ์์ฑ์๊ฐ ํ์ต์ ํตํด ์ด๋ฅผ ์ค์ด๋ ค๊ณ ํ ๋ ๋ ํฐ ๊ทธ๋๋์ธํธ๋ฅผ ๋ฐ๊ฒ ๋๋ค.
MinMax ๊ฒ์
minGโmaxDโV(D,G)
- ํ๋ณ์ D๋ ์ด ํจ์ V(D,G)๋ฅผ ์ต๋ํํ๋ ค๊ณ ํ๋ค. ์ฆ, ์ง์ง ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ์ง์ง๋ก, ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์ฌ๋ฐ๋ฅด๊ฒ ๊ฐ์ง๋ก ํ๋จํ๋๋ก ํ์ตํ๋ค.
- ์์ฑ์ G๋ ์ด ํจ์๋ฅผ ์ต์ํํ๋ ค๊ณ ํ๋ค. ์ฆ, ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์ง์ง๋ก ํ๋จํ๋๋ก ํ์ตํ๋ค.
Gradient descent? Gradient ascent!
์์ฑ์์ ๋ชฉํ๋ ํ๋ณ์๊ฐ ์์ฑ๋ ๊ฐ์ง ๋ฐ์ดํฐ๋ฅผ ์ง์ง ๋ฐ์ดํฐ๋ก ๋ถ๋ฅํ๊ฒ ํ๋ ๊ฒ์ด๋ค.
๋ฐ๋ผ์ ๋ค์์ ๊ฐ์ ์ต์ํํ๋ ค๊ณ ํ๋ค.
ํ์ง๋ง ์ด ํํ์ ํ์ต ์ด๊ธฐ์ ๊ทธ๋๋์ธํธ ์์ค ๋ฌธ์ ๋ฅผ ์ผ์ผํฌ ์ ์๋ค. ์ ์์ ์ต์ํํ๋ ๊ฒ ์ small grdient ๋ฅผ ์ง๋๊ณ ์์ด ์ ๋๋ก ํ์ต๋ ์ฌ์ง๊ฐ ์ค์ด๋ ๋ค.
๋ฐ๋ผ์ ์ค์ ๋ก๋ ๋ค์๊ณผ ๊ฐ์ ๋์์ ์ธ ์์ค ํจ์๋ฅผ ์ฌ์ฉํ๊ธฐ๋ ํ๋ค.
์ด ๋์์ ์ธ ์ ๊ทผ ๋ฐฉ์์์๋ D(G(z)) ๊ฐ ๋์์ง๋๋ก ์ต์ ํํ๋ค. ์ฆ, ์์ฑ๋ ๊ฐ์ง ๋ฐ์ดํฐ๊ฐ ์ง์ง ๋ฐ์ดํฐ๋ก ๋ถ๋ฅ๋ ํ๋ฅ ์ ์ต๋ํํ๋ ค๊ณ ํ๋ค.
log(x) ๋ฅผ ์ต๋ํํ๋ ๊ฒ์ ์๋์ ์ผ๋ก ํฐ ๊ทธ๋๋์ธํธ๋ฅผ ์ง๋ ์ ๋๋ก ํ์ต๋ ์ ์๋๋ก ๋๋๋ค.
GAN Training Alogorithm
k step ๋์ :
ํ๋ณ์ D
- m๊ฐ์ ๋ฏธ๋๋ฐฐ์น ๋ ธ์ด์ฆ ์ํ์ ๋ฝ๋๋ค.
- ๋ฐ์ดํฐ ์์ฑ distribution Pdata(x) ๋ก๋ถํฐ m๊ฐ์ ์ํ์ ์์ฑํ๋ค.
- stochastic gradient๋ฅผ ๋์ด๋ ๋ฐฉํฅ์ผ๋ก ํ๋ณ์๋ฅผ ์ ๋ฐ์ดํธํ๋ค.
์์ฑ์ G
- m๊ฐ์ ๋ฏธ๋๋ฐฐ์น ๋ ธ์ด์ฆ ์ํ์ ๋ฝ๋๋ค.
- stochastic gradient๋ฅผ ๋ฎ์ถ๋ ๋ฐฉํฅ์ผ๋ก ์์ฑ์๋ฅผ ์ ๋ฐ์ดํธ ํ๋ค.
ํน์ง
๋๋ถ๋ถ์ ๊ทผ๋ ์ํคํ ์ณ๋ generator ์ disciminator ๊ฐ ๋ชจ๋ CNN ์ธ Deep Convolution GAN(DC-GAN) ์ ๊ธฐ๋ฐํ๊ณ ์๋ค. '
- ๋์ ํด์๋์ ์ด๋ฏธ์ง๋ฅผ ์์ฑํ๋ ๋ฐ์ ์ ์ฉํ๋, distribution ์ ์ด๋ป๊ฒ ๋ชจ๋ธ๋งํ๋์ง๋ ์๊ธฐ ํ๋ค๋ค.
- Diffusion model ์ ๋ฑ์ฅ์ผ๋ก ๋ ์ด์ ์ฌ์ฉ๋์ง ์๋๋ค.
Cycle GAN
์ฃผ์ด์ง ๋ ๋๋ฉ์ธ ๊ฐ ์๋ฐฉํฅ์ผ๋ก ์ด๋ฏธ์ง๋ฅผ ๋ณํ(Style-transfer)ํ ์ ์๋ ์๋ก์ด ํํ์ GAN์ด๋ค.
์ด ๋ชจ๋ธ์ ๊ฐ ๋๋ฉ์ธ์ ํด๋นํ๋ ๋ฐ์ดํฐ๊ฐ pair ๋ก ์ฃผ์ด์ง์ง ์์์๋์๋ ํ์ตํ ์ ์๋ค.
- ๋๊ฐ์ ์๋ก ๋ค๋ฅธ generator network ๋ฅผ ํ์ต์ํจ๋ค. ํ๋๋ ์๋ณธ -> ๋์ ์ผ๋ก, ๋๋จธ์ง ํ๋๋ ๋์ -> ์๋ณธ ์ผ๋ก ๋ณํํ๋๋ก ํ๋ค.
- ์ด ๋, ๋์ ๋๋ฉ์ธ์์ ์์ฑ๋ ์ํ๋ค์ discriminator network ์ ์ค์ ์ด๋ฏธ์ง๋ค๊ณผ ๊ตฌ๋ณ์ด ๋ถ๊ฐ๋ฅํด์ผํ๋ค.
- generator๋ cycle-consistent ํ๋ค. ์๋ณธ์ ๋์ ๋๋ฉ์ธ์ผ๋ก ๋ณํํ ๋ค์ ๋ค์ ์๋ณธ ๋๋ฉ์ธ์ผ๋ก ๋ณํํ๋ฉด ์๋ณธ ์ด๋ฏธ์ง๋ฅผ ์ป์ ์ ์๋ค.
ํ์ต ๊ณผ์
Generator 1์ ๊ตฌ์กฐ๋ฅผ ์ ์งํ๋ฉด์ ์๋ณธ -> ํน์ ๋๋ฉ์ธ์ผ๋ก ๋ณํํ๋ ๊ฒ์ ๋ฐฐ์ด๋ค.
Generator 2๋ ๊ตฌ์กฐ๋ฅผ ์ ์งํ๋ฉด์ ํน์ ๋๋ฉ์ธ -> ์๋ณธ์ผ๋ก ๋ณํํ๋ ๊ฒ์ ๋ฐฐ์ด๋ค.
๊ทธ๋ฆฌ๊ณ Generator ๋ ์๋ณธ ์ด๋ฏธ์ง์ ์ฌ์์ฑ๋ ์ด๋ฏธ์ง ๊ฐ์ ์ฐจ์ด์ธ reconstruction loss ๋ฅผ ์ต์ํํ๋๋ก ํ์ต๋๋ค.
๊ทธ๋ฆฌ๊ณ Disciminator ๋ ์ค์ (real) ์ํ์ ์์ฑ๋ ์ํ์ ๋ถ๋ณํ๋ ์ญํ ์ ํ๋ค.
๋ณธ ๊ณผ์ ์ ๋ฐ๋ณตํ๋ฉด์ ๊ทธ๋ด๋ฏํ ์คํ์ผ ๋ณํ ์ด๋ฏธ์ง๋ฅผ ์ป์ ์ ์๊ฒ ๋๋ค.
ํ์ฉ
Cycle GAN์ ์ฃผ๋ก ์ด๋ฏธ์ง ๋ณํ ์์ ์ ์ ์ฉ๋๋ฉฐ, ์๋ฅผ ๋ค์ด ์ผ๊ตด ์ฌ์ง์์ ๊ทธ๋ฆผ์ผ๋ก ๋ณํํ๊ฑฐ๋ ์ฌ๋ฆ ํ๊ฒฝ ์ฌ์ง์ ๊ฒจ์ธ ํ๊ฒฝ ์ฌ์ง์ผ๋ก ๋ณํํ๋ ๋ฑ์ ์์ ์ ์ฌ์ฉ๋๋ค. ๋ํ, Cycle GAN์ ๋ฐ์ดํฐ ์ฆ๊ฐ(Data Augmentation) ๋ฐ ์คํ์ผ ์ ์ก(Style Transfer)๊ณผ ๊ฐ์ ์์ฉ ๋ถ์ผ์์๋ ํ์ฉ๋ ์ ์๋ค.