クラスタ中心を求め,入力サンプルを各クラスタにグループ分けします.
パラメタ: |
|
---|
関数 kmeans は, clusterCount 個のクラスタの中心を求め,入力サンプルを各クラスタに分類する k-means アルゴリズムの実装です.出力として, samples 行列の 行目のサンプルが属するクラスタの(0基準の)インデックスが, に格納されます.
この関数は,次のように計算されるコンパクト尺度を返します.
全試行の終了後,最もよい(小さい)値が選択され,それに対応するラベルとコンパクト尺度が戻り値として返されます. また,基本的に次のようにして,ユーザはこの関数の基本機能だけを利用することができます.まず,試行回数を1にセットし,フラグ( flags = KMEANS_USE_INITIAL_LABELS )をセットして,独自アルゴリズムによりラベルを毎回初期化します そして,最良の(最もコンパクトな)クラスタリングを選択します.
要素の集合を同値クラス(同値類)に分割します.
パラメタ: |
|
---|
汎用関数 partition は, 個の要素の集合を1つまたは複数の同値類に分割する のアルゴリズムの実装です.これについては http://en.wikipedia.org/wiki/Disjoint-set_data_structure で説明されています.また,この関数は,同値類の個数を返します.