#68 Section 23 クラスタリング(4)クラスターラベルの付加
チュートリアルの『Assign Model』に進みます。
assign_model関数の実行
assign_model関数は、どのクラスター(Cluster 0, Cluster 1・・・)に属するかを元の入力データセットに新しい列として追加して返してくれます(クラスターラベルの付与)。
()内の引数は、create_model関数で宣言したモデルの名称を記入します。
Section22で、kmeans = create_model('kmeans')としていますので、ここでは、『kmeans』を記入しています。
Section22の参考で、下記のようなモデルを定義しましたが、その『kmeans2』を引数として記入すると、下記のスライドのようになります。
kmeans2 = create_model('kmeans', num_clusters = 3)
indexが『500』の行のクラスターが、『Cluster 3』から『Cluster 0』
へ変化しました( 『Cluster 1』も『Cluster 2』も別物ですが…)。
通常、『kmeans』、『kmeans2』等のクラスターラベルの付いたデータを使って、それぞれの平均値や最大・最小値などの要約統計量を算出すること等により、データ分析を進めていくことになります。
コメント
コメントを投稿