#49 Section5 分類(2) 前処理

ここからは、『setup』関数によるいくつかの前処理機能を体験していきます。 まずは、モジュールのインポートと setup 関数の実行です。 下記の公式『Tutorials』の下記のコードは、1行目は解説で、2行目は、PyCaretのうち分類に用いるモジュール『 classification 』をインポートしています。このモジュールは、 二項分類 または 多項分類 に使用できます。さらに、 『 setup 』関数によるいくつかの 前処理 機能、18以上のすぐに使える アルゴリズム と、学習済み モデルの性能を分析 するためのプロットが用意されています。 ワイルドカード 「 * 」を使うとモジュールで公開されているすべての関数や変数などがインポートされて使えるようになります。 3行目は、PyCaretの分類モジュールに含まれる『setup』関数で、欠損値処理、データ分割などの前処理を行っています。 # import pycaret classification and init setup とあり、setup関数を初期化するような説明となっていますが、『init』は初期化という意味ではなく、機械学習の実験を開始するための準備作業全体を指していますから、ここではsetup関数を実行して前処理を行うという意味で理解しておきましょう。 setup 関数について詳しく説明します。setup関数は、最小限、『 分析するデータ名 』→ data 、『 目的変数 』→ target 、『 後で再現可能にするための擬似乱数設定 』→ session_id という引数が必要になります。 session_idは、無くても動きますが、毎回違う結果が出てくることがありますので固定しておきましょう。 また、その他の引数の主なものは、下記のとおりです。 『 ignore_features 』→無視したい特徴量のリスト 『 normalize True 』→Trueに設定するとデータが正規化される 『 train_size 』→訓練データのサイズ、例:=0.7では70%が学習用データとして使用される 『 log_data 』→Trueにすると、学習およびテストデータがCSV形式で保存される これが引数でできるなんて!ちょっとワクワクしませんか? その他は@Asagumo63さ...