k-means++: The Advantages of Careful Seeding
参考
概要
k-meansの初期値の決め方を改良したバージョンである. Wikipediaではめっちゃ簡単に説明がなされている.
- 点の集合 \(D\) から一つ、一様ランダムに点 \(c\) を選ぶ
- 点 \(x_i\) について、確率 \(D(x_i, c) / Z\) を与える
- その確率に基づいて \(k\) 個、点を選ぶ
- あとは k-means する
以上である.
論文ではこれ以上に近似比率 (なんの?) の議論とかむっちゃしてる.