Mais conteúdo relacionado
Mais de Katsushi Yamashita (6)
はじパタ 10章 クラスタリング 前半
- 2. +
omae dare yo
n
やまかつ(@yamakatu)
n
フルスタックイクメンエンジニア
n
主に検索方面
n
gihyo.jp Mahoutで体感する機械学習の実践
n
n
合い言葉は「読まずにはてブだけ」
一部の心ない人たちからソーシャルチンピラって呼ばれてる
n
インターネット怖い
- 12. +
10.2 非階層型クラスタリング
(K-平均法) 1/2
n
非階層型クラスタリング、と言うよりK-Meansの話
n
目的
n
n
n
d次元のN個のデータ
これをあらかじめ定めたK個のクラスタに分類する
定義
n
各クラスタの代表ベクトルの集合
k番目の代表ベクトルが支配するクラスタ
帰属変数
n
K-Meansの評価関数
n
最適化
n
n
- 13. +
10.2 非階層型クラスタリング
(K-平均法)
2/2
n
アルゴリズム(逐次最適化)
n
以下、TJO氏のサイト wikipedia(
http://en.wikipedia.org/wiki/K-means_clustering )から
1.
n
3.
4.
収束するまで3〜4を繰り返す
ちなみにKmeansの初期化ってやりかた2つあるよね
n 本:データをクラスタにランダムに割り当てる
n wikipedia:ランダムに重心を決める
ちなみにK個のKはCanopyクラスタリングで求める方法があるぜよ
n
n
2.