[1906.00446] Generating Diverse High-Fidelity Images with VQ-VAE-2

深層学習 オートエンコーダ 生成モデル VAE

概要

VQ-VAE の version 2.

VQ-VAE を大きなサイズの画像にも適用できるようになった.

方法

まず VQ-VAE の学習は 2 stages に分けられる. オートエンコーダーの学習と, 潜在空間の事前分布の学習.

stage-1: VQ-VAE training

エンコーダをさらに2つに分けて, 階層的エンコードを行う. ここでは \(E_1, E_2\) とする.

これで VQ-VAE と同じように \(L(x, \tilde{x})\) を考えて学習する.

stage-2: Piror training

潜在空間に関する事前分布を学習する.

よくわからん