#71 Section 26 クラスタリング(7)モデルの保存・再利用
クラスタリングの最後は、モデルの保存と再利用の方法を体験していきます。
1.モデルの保存
クラスタリングの最後は、save_model関数を使用します。今まで前処理を行って評価してきたモデルをディスクに保存することができます。
save_model(選択したモデルの名前, '保存するモデルの名前')
今回は、モデル『kmeans』を『kmeans_pipeline』という名前で保存します。 『kmeans_pipeline』は、現在の作業ディレクトリに、モデルのIDに *.pkl の拡張子が付いたファイル(*pickle形式)として保存されます。これは、後でいつでも利用することができます。
*pickle形式:Pythonのメモリ上にあるデータ構造(例えば、リスト、辞書、クラスのインスタンス、そしてPyCaretの学習済みモデルなど)を、ファイルに書き込んで保存できる形式のことです。そして、保存したファイルから元のPythonオブジェクトを復元できます。
pickle形式のファイルは、path引数で指定した場所、または今回のようにpath引数を省略した場合は現在の作業ディレクトリに保存されます。関数の出力や、ファイルシステムを直接確認することで、保存場所を特定できます。ただし、 pickleファイルはテキスト形式ではなく、コンピュータが効率的にデータを読み書きするためのバイナリ形式で保存されています。そのため、Googleドライブの検索エンジンでは、ファイルの内容をテキストとして解析することが難しく、キーワードで検索することができません。
2.モデルの保存 出力
save_model関数を実行すると、その出力には、個々の処理ステップの詳細と、最終的な学習済みモデルの種類とハイパーパラメータ、そして保存されたファイルの名前が出てきます。
その記載の内容は、下記のスライドを参照願います。
3.モデルの利用
下記のload_model関数を使うと、保存されたモデルを読み込む(ロードする)ことができます。
load_model(‘保存したモデル名‘)

4.モデルの利用 出力
load_model関数を使うと保存されたモデルを読み込むことができますが、その出力には、個々の処理ステップの詳細と、最終的な学習済みモデルの種類とハイパーパラメータ、そして保存されたファイルの名前が記載されています。
この情報があれば、保存されたパイプラインがどのような処理を行い、どのようなモデルを含んでいるかを正確に把握することができます。
詳細は、下記のスライドをご覧ください。
コメント
コメントを投稿