#59 Section14 回帰（３）モデルの評価・比較

今回は、「モデルの評価・比較」を体験していきましょう。

『compare_models』関数は、ライブラリで使用可能なすべてのアルゴリズム（PyCaretでは『モデル』と言います）を交差検証を用いて訓練し、評価指標を算出して性能を評価します。この関数の出力は、交差検証での平均スコアを含む評価指標一覧（次スライド参照）で、様々なアルゴリズムの性能を比較できます。

『分類』で行ったように、関数型API、オブジェクト指向APIの二つの方法があります。順番にコードを実行しましょう。

また、『compare_models(sort=“評価指標”) 』で、任意の指標で結果を並べ替えることもできます。

compare_models関数を使った前のスライドのコードを入力すると、下記の結果が出力されます。

表頭には、評価指標がいくつか並んでいます。

また、それぞれのモデルは、デフォルトで決定係数（R2）の降順に表示されます！

さて、ここからは、前のスライドに出てきた評価指標を解説していきます。

まずは、平均絶対誤差（MAE/Mean Absolute Error）

平均絶対誤差（MAE/Mean Absolute Error）は、各データに対して「予測値と正解値の差（誤差）」の絶対値を計算し、その総和をデータ数で割った値（平均値）を算出したもの。スライドの式で算出されます。

平均絶対誤差に普遍的な目安はありませんが、数値が小さいほど予測精度が高いと評価されます。

平均絶対誤差はあくまで相対的な指標ですから、過去の類似データで比較したり、複数のモデルで比較する等して使用します。

【参考】　https://atmarkit.itmedia.co.jp/ait/articles/2105/19/news022.html

２番目は、平均二乗誤差（MSE/Mean Squared Error）

平均二乗誤差（MSE/Mean Squared Error）は、各データに対して「予測値と正解値の差（誤差）」の二乗の総和を計算し、その総和をデータ数で割った値（平均値）を算出したもの。下記のスライドに示す式で算出されます。

平均二乗誤差に普遍的な目安はありませんが、0に近いほど予測値と実測値の差（誤差）が小さいことを示します。誤差を2乗するため、大きな誤差（外れ値）が評価に与える影響が大きくなります。

平均二乗誤差はあくまで相対的な指標ですから、過去の類似データで比較したり、複数のモデルで比較する等して使用します。

【参考】　https://atmarkit.itmedia.co.jp/ait/articles/2105/24/news019.html

３番目は、二乗平均平方根誤差（RMSE/Root Mean Squared Error）

二乗平均平方根誤差（RMSE/Root Mean Squared Error）は、３番目に示したMSEの平方根。下記のスライドに示す式で算出されます。

二乗平均平方根誤差に普遍的な目安はありませんが、0に近いほど予測値と実測値の差（誤差）が小さいことを示します。誤差を2乗するため、大きな誤差（外れ値）が評価に与える影響が大きくなります。二乗平均平方根誤差はあくまで相対的な指標ですから、過去の類似データで比較したり、複数のモデルで比較する等して使用します。

【参考】　https://atmarkit.itmedia.co.jp/ait/articles/2105/24/news019.html