Translate

#63 Section 18 回帰(7)モデルの保存

さて、回帰も大詰めとなってきました。



1.モデルの保存

さて、予測したモデルを、save_model関数を使用して、今までの分析の流れを後で使用するために保存していきます。 

使うコードは、

save_model(選択したモデルの名前, '保存するモデルの名前')

今回は、「my_first_pipeline」という名前で保存します。 「my_first_pipeline」は、現在の作業ディレクトリに、モデルのIDに *.pkl の拡張子が付いたファイル(*pickle形式)として保存されます。これは、後でいつでも利用することができます。

*pickle形式:Pythonのメモリ上にあるデータ構造(例えば、リスト、辞書、クラスのインスタンス、そしてPyCaretの学習済みモデルなど)を、ファイルに書き込んで保存できる形式のことです。そして、保存したファイルから元のPythonオブジェクトを復元できます。

pickle形式のファイルは、path引数で指定した場所、または今回のようにpath引数を省略した場合は現在の作業ディレクトリに保存されます。ただし、Googleドライブの検索エンジンでは、ファイルの内容をテキストとして解析することが難しく、キーワードで検索することができません




2.モデルの保存 出力

save_model関数の主なアウトプットは、モデルだけでなく、データの前処理方法全体が一つのパイプラインとして保存されたこと、そしてそのパイプラインに含まれる個々の処理ステップの詳細と、最終的な学習済みモデルの種類とハイパーパラメータ、そして保存されたファイルの名前を示しています。

この情報があれば、保存されたパイプラインがどのような処理を行い、どのようなモデルを含んでいるかを後で正確に把握することができます(確認している人は少ないですが・・・)。




滅多に使わないですが、今までの作業を振り返る意味で、出力内容を確認していきましょう。

下記の2枚のスライドを見てみましょう。






3.モデルの再利用

save_model関数を使ったモデル(前処理方法などを含む)を呼び出す(ロードする)ためには、

load_model(‘保存したモデル名‘)

を使います。ここでは、読み込んだモデルを「loaded_best_pipeline」と名付け直しています。

出力は、下記のスライド内の①のようになります。

出力内に表示された「▶」をクリックすると、読み込んだモデルの詳細な説明が現れます。

これは、 『save_model』関数で保存した際の出力と同じ内容になっていますので、省略します。




さて、次回は、下記ののまとめです。

Pycaretに慣れてきましたでしょうか?












コメント