Unpaired Image-to-Image Translation using Cycle-Consistent Adversarial Networks
Abstract
Image-to-Image ๋ณํ์ ์ด๋ฏธ์ง ์์ ์ธํธ๋ฅผ ์ฌ์ฉํด์ ์ ๋ ฅ ์ด๋ฏธ์ง์ ์ถ๋ ฅ ์ด๋ฏธ์ง ์ฌ์ด์ ๋งคํ์ ํ์ตํ๋ ๊ฒ์ด ๋ชฉํ
โ ๋๋ถ๋ถ์ ์์ ์ ๊ฒฝ์ฐ, ์์ผ๋ก ๋ชจ๋ ๋ฐ์ดํฐ๋ฅผ ํ์ต ํ ์ ์๋ค๋ ํ๊ณ์ ์กด์ฌ
์์ผ๋ก ๋ ์์๊ฐ ์๋ ๊ฒฝ์ฐ, X โ Y ๋ก ์ด๋ฏธ์ง๋ฅผ ๋ณํํ๋ ๋ฐฉ๋ฒ์ ํ์ตํ๊ธฐ ์ํ ๋ฐฉ๋ฒ ์ ์
โ G:XโY ๋ฅผ ์ญ๋งคํ F:YโX ์ ๊ฒฐํฉ. F(G(X))โX ์ด ์ ์ฉ๋๊ธฐ ์ํด a cycle consistency loss ๋์
Introduction

์ผ์ชฝ์ ์ฌ์ง๋ค์ Paired data ์ด๋, ์ค๋ฅธ์ชฝ์ ์ฌ์ง๋ค์ Unpaired data ๊ตฌ์ฑ์ฒด
์๋ก ์์ด ์๋ ๊ต์ก ๋ฐ์ดํฐ๋ X์ Y๊ฐ ์ผ์นํ๋ ์ ๋ณด๋ ์ ๊ณต๋์ง ์์
Cycle GAN ๋ณธ ๋ ผ๋ฌธ์ ์์ผ๋ก ๊ตฌ์ฑ๋ ํ๋ จ ์์ ๊ฐ ์๋ ๊ฒฝ์ฐ์ ํ๋์ image collection์ ์๋ ํน์ง์ ์ก์๋ด ๋ค๋ฅธ image collection์ผ๋ก ์ด๋ป๊ฒ ๋ณํ ์ํค๋ ํ๋ จ์ ํ์ตํ ์ง ๊ทธ์๋ํ ๋ฐฉ๋ฒ์ ์ ์ํจ
์์ผ๋ก ์ ์ถ๋ ฅ ๋ ์์ ๊ฐ ์์ ๋, ๋๋ฉ์ธ๊ฐ์ ๋ณํ์ ํ์ต ํ ์ ์๋ ์๊ณ ๋ฆฌ์ฆ์ ์ฐพ๋ ๊ฒ์ด ๋ชฉํ
mapping G : X โ Y training
yโY ์ ๊ตฌ๋ณ๋์ง ์์์ผ ํ๋ output y^ = G(x), xโX
๋ฐ๋์ ํ๋ จ(y์ y^๋ฅผ ๋ถ๋ฅ)์ ์ํด ํ๋ จํจ
์ผ๋ฐ์ ์ผ๋ก G๊ฐ ํ๋ฅ ์ ์ผ ๋, ๊ฒฝํ์ ๋ถํฌ Pdata(y) ์ ๋น์ทํ output y^๋ฅผ ์ ์ถํด ๋
optimal G๋ domain X๋ฅผ Y์ ๋์ผํ ๋ถํฌ๋ฅผ ๋ฐ๋ฅด๋ Y^๋ก ๋ณํํจ
๊ทธ๋ฌ๋ ์ด๋ฌํ ๋ณํ์ x์ y๊ฐ ์๋ฏธ์๋ ๋ฐฉ์์ผ๋ก ์์ ์ด๋ฃฌ๋ค๋ ๊ฒ์ ๋ณด์ฅํ์ง ์์ y^์ ๋ํด ๋์ผํ ๋ถํฌ๋ฅผ ์ ๋ํ๋ ๋งคํ G๋ ๋ฌดํํ ๋ง์
ํ์ค์ ์ธ ์ ์ฐจ๋ ๋ชจ๋ ์ ๋ ฅํ ์ด๋ฏธ์ง๊ฐ ๋์ผํ ์ถ๋ ฅ ์ด๋ฏธ์ง์ ๋งคํ๋๊ณ ์ต์ ํ๋ ์งํ๋์ง ๋ชปํ๋ mode collapse ์ ๋๋ฌํจ
์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ๊ธฐ ์ํด '์ฃผ๊ธฐ์ ์ผ๊ด์ฑ์ด ์์ด์ผ'ํ๋ ํน์ฑ์ด ์์ด์ผ ํจ
G:XโY, F:YโX ๊ฐ ์์ ๋, G์ F๋ ์๋ก ๋ฐ๋์ด๊ณ , ๋ ๋งคํ์ ๋ชจ๋ bijection์ด์ด์ผ ํจ
G์ F ๋งคํ์ ๋์์ ํ๋ จํ๊ณ , F(G(x)) โ x , G(F(y)) โ y๋ฅผ ๋ง์กฑํ๋ cycle์ consistency loss๋ฅผ ์ถ๊ฐํ์ฌ structural assumption ์ ์ ์ฉ์ํด
์ด loss๋ฅผ domain X์ Y์ adversarial loss์ ๊ฒฐํฉํ๋ฉด ์ด๋ฏธ๋์ ๋ณํ์ ๋ํ ์์ ํ ๋ชฉํ๊ฐ ๋ฌ์ฑ๋จ
'๐ฑ Project > 2021Captone : Cycle GAN Web' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
Cycle-Consistent Adversarial Networks ๋ ผ๋ฌธ๋ฆฌ๋ทฐ #3 (0) | 2022.02.04 |
---|---|
Cycle-Consistent Adversarial Networks ๋ ผ๋ฌธ๋ฆฌ๋ทฐ #2 (0) | 2022.01.18 |
Cycle GAN ์ ๋ฆฌ #2 (0) | 2022.01.14 |
Cycle GAN ์ ๋ฆฌ #1 (0) | 2022.01.14 |