分類器
二値分類において、学習データの偏りが大きい場合は downsampling+bagging するのがよい.
+
データセット \(D=D^+ + D^-\) について、 \(|D^+| = |D^-|\) となるまで、多い方からランダムに事例を除外.
初めの偏ったデータから、独立に sampling して作った B 個のデータを作って、 それぞれについてモデルを B 個訓練してアンサンブル.