Translate

#68 Section 23 クラスタリング(4)クラスターラベルの付加

チュートリアルの『Assign Model』に進みます。




assign_model関数の実行

assign_model関数は、どのクラスター(Cluster 0, Cluster 1・・・)に属するかを元の入力データセットに新しい列として追加して返してくれます(クラスターラベルの付与)。

()内の引数は、create_model関数で宣言したモデルの名称を記入します。

Section22で、kmeans = create_model('kmeans')としていますので、ここでは、『kmeans』を記入しています。





Section22の参考で、下記のようなモデルを定義しましたが、その『kmeans2』を引数として記入すると、下記のスライドのようになります。

kmeans2 = create_model('kmeans', num_clusters = 3)

indexが『500』の行のクラスターが、『Cluster 3』から『Cluster 0』
へ変化しました( 『Cluster 1』も『Cluster 2』も別物ですが…)。

通常、『kmeans』、『kmeans2』等のクラスターラベルの付いたデータを使って、それぞれの平均値や最大・最小値などの要約統計量を算出すること等により、データ分析を進めていくことになります。









 

コメント