Translate

#57 Section 12 回帰(1)教材の用意&PyCaretのインストール/インポート

ここからは、『回帰』のコードの解説に入ります。

→ スライドは、クリックすると拡大できます!




PyCaretが予測の途中でどのような処理や計算をしているかを体験していきましょう。




PyCaretのホームページ (1)

まずは、教材の準備をしていきます。

PyCaretのホームページから『DOCS』をクリックし、さらに『Tutorials』をクリックします。




PyCaretのホームページ (2)

『Tutorials』にある『Regression』の『Quick start』の部分を今回の教材にします。

『Regression』は、①教師あり学習の一種で、連続する値の傾向をもとに予測を行うことです。日本語で、『回帰』と言います。



PyCaretのホームページ (3)

『Colab』をクリックすると、『Colab』の『Tutorial - Regression.ipynb』という名前のノートブックが現れます。この状態では、まだGoogleドライブに保存されているわけではありませんので、『ドライブにコピー』をクリックします。

その後、ノートブックの名称を『Regression』に変更、ファイル位置の移動(ここでは、『機械学習』フォルダーに移動)等を行います。教材の準備は完了です。




PyCaretのインストール/インポート    

Colabには、PyCaretがインストールされていませんので、先ずはPyCaretをインストールしましょう。

その前に、『#56 分析環境再構築/コラボのPythonバージョンアップ』を参考にして、Pythonのダウングレードを行います。

通常の『!pip install paycaret』では、すべてのものをインストールすることはできません。 paycaretに続けて[full]を書くとフルバージョンをインストールすることができます。






ColabでPyCaretをインポートすると、数分経過してから下記のように『セッションを再起動する』とのアラームが出てきます。Colabは最新に近いパーツで動いていますが、PyCaretはその最新のパーツに対応していないためです。

でも、ご安心を! 『セッションを再起動する』をクリックして、再起動すれば、PyCaretは問題なく稼働します。




PyCaretをインポートが完了し、稼働しているかどうか確かめるために、PyCaretのバージョンを確かめてみましょう。

PyCaretのバージョンは、3.3.2ということがわかりました。ちゃんとインストールされているようです。




分析データを読み込む

次に分析するデータを読み込みます。

PyCaretには、年齢、性別、BMI、子供の数、喫煙者かどうか、地域情報が含まれている『insurance』という保険料を予測するためのデータが入っています。得られたデータを『data』と宣言しています。




データ「insurance」の詳細

目的変数が『保険料』で、説明変数が『年齢』、『性別』、『BMI』、『子供の数』、『喫煙者かどうか』、『地域情報』という構造になっています。

BMIというのは、Body Mass Indexの略です。体重と身長から算出される肥満度を表す体格指数です。




一連の流れを動画で見てみましょう!




さて、ここからは、回帰を使った分析を体験していきましょう!

コメント