Random Image Cropping And Patching (RICAP) という画像認識のためのデータ水増し手法を提案する. 方法は以下の画像の通り
つまり訓練のための画像の領域をランダムに4分割して, それぞれに別な4枚の画像からパッチを持ってきて埋める. ラベルは面積に比例して混ぜたものを使う. ある意味では mixup と同じことをやってる.
ただしこの領域の分割の仕方はその割合を Beta 分布に従って行い, そのパラメータを探索したところ CIFAR-10 や CIFAR-100 で Beta(0.3, .0.3)
くらい? が良かったぽい. Beta 分布は mixup でも使ってて, Beta(alpha, beta)
は x in [0, 1]
の上の分布であって, さらにalpha=beta
のとき \(x=0\) や \(x=1\) の端っこのときが一番出やすいような分布. (cf. wikipedia/ベータ分布)