Translate

#46 Section2 機械学習とは?

コンピュータがデータを読み込むことで自動的にルールやパターンを見出し、その結果を活かして分類や予測を行う仕組み全体のことを機械学習といいます。

今回は、機械学習とはどんなものか、どんな手法があるのかを解説します。

→ スライドは、クリックすると拡大できます!



機械学習はAIを実現するための重要な要素であり、AIの一部であると言えます。

そこで、まずは、AIの歴史を振り返ってみましょう。





人工知能(AI)の研究は1950年代から続いていますが、その過程ではブームと冬の時代が交互に訪れています。それぞれのブームの終了時に、AIに関する悲観的な意見が出てブームは終焉し、研究者にとっては冬の時代が訪れました。

第一次AIブーム終焉:迷路やチェスなどの簡単なゲームをさせることができるなど様々な開発がなされましたが、人々が期待していた「現実に起きている問題を自分で解決」するまでには至らず、1970年代になると冬の時代を迎えます。

第二次AIブーム終焉:ブームを迎えて登場したMYCINという医療のエキスパートシステムでは、患者の診断は約65%の正解率を誇っていました。「専門医の診断」の正解率(約80%)には及ばないものの、「細菌感染の専門家でない医師」よりは優秀な成績でした。しかし、「エキスパートシステムの開発に膨大な手間と時間がかかる」、「人間が使う曖昧な表現をエキスパートシステムではルール化できない」等の理由により、発展に歯止めがかかり、ブームは終焉を迎えます。

2010年頃から、機械学習*表現学習からなる第三次AIブームが始まり、これは現在も続いています。

*表現学習:画像・映像・音声・テキストなどの非構造化データでは、人間の判断で特徴量を選択することが困難です。そこで、機械学習自身に特徴量を発見させるアプローチが考え出されました。この表現学習を行う機械学習のアルゴリズムの一つを深層学習(ディープラーニング)と言います。

また、現在は、ChatGPTに代表される生成AIによる第四次のブームが同時並行で進んでいます。

「4th STEP 機械学習」では、深層学習(ディープラーニング)の基礎となる機械学習を学んでいきます。





機械学習は、これまで経験や勘に頼っていた判断をデータに基づいて行うことで、客観的な分析や予測を可能にします。また、大量のデータを効率的に処理し、人間の労働力を軽減することも可能です。既に、画像認識、音声認識、自然言語処理、予測分析、推薦システムなど、実務で幅広く活用されているひっぱり凧の技術となっています。

【例】 ECサイトでの商品推薦、スパムメールのフィルタリング、金融市場の予測、マーケティング戦略立案時の基礎資料等

機械学習は、学習の方法により、下記の3つに大きく分類され、それぞれ数種類の手法があります。主なものは、下記のとおりです。

① 教師あり学習

  ・ 回帰
  ・ 分類

② 教師なし学習

  ・ クラスタリング
  ・ 主成分分析(PCA)
  ・ アソシエーション分析

③ 強化学習





① 教師あり学習





特徴を表す情報(説明変数)と正解を表す情報(目的変数)がセットになった状態のデータを用いてコンピュータに学習させる手法です。

【回帰】 主な目的は、連続する値の傾向をもとに予測を行うこと。例えば、下記のような予測を行う時に使われます。

● 過去の気温データを基にして明日の気温を予測
● 新しい店舗を開設する際に、検討している席数、最寄り駅からの徒歩時間、モーニングサービスの有無を考慮しながら売上を予測
●トッピングの数、パンの生地、直径からピザの価格を予測

【分類】 主な目的は、分析したいデータが所属するクラス分けを予測すること。例えば、下記のような予測を行う時に使われます。

● 会員になった期間、購入品目、購入頻度から、新商品を購入する人を予測
● 電子メール中に含まれる単語から、スパムメールか通常メールかを判別
● 顧客の支払い履歴・取引情報から与信判断


② 教師なし学習



主な種類には、次のようなものがあります。

【クラスタリング】 特徴が近い(似ている/距離が近い)データを集めて集団に分ける分析手法。例えば、下記のような時に使われます。

● アンケート調査にて、化粧品利用の満足度や意向、化粧品に対する意識調査を実施した際、意識調査でグループ分けし満足度を比較。

● 各ブランドを特性ごとの評価値によりグループ分けし、該当するブランド・グループの購入者特徴を調査

【主成分分析(PCA)】 多くの量的な説明変数の中から、主成分と呼ばれる複数の変数を組み合わせたものに要約する手法。例えば、下記のような時に使われます。

● 身長と体重(二次元のデータ)から肥満度を示すBMI(一次元のデータ)に変換

● 野菜を評価する色や形、大きさ、味などの多くの変数を持つデータから、「色と形が似ている野菜」や「大きさと味が関連する野菜」など、新たな指標(主成分)から、固有値や寄与率を使い、データの背後にある構造や傾向を探る時

【アソシエーション分析】 POSレジデータ等のデータを分析して、「もしこうだったら、このようになる(if-then)」という関係性を導く分析方法。例えば、下記のような時に使われます。

● ネット通販の購買データから、商品Aを買ったらこんな商品も買っているという確率を求める。
● 会員の属性データとレシート単位の購買データから、男性がベビー用おむつとビールを同時に購買している率が高いことを発見。


③ 強化学習



強化学習は教師あり学習に似ていますが、教師による明確な「答え」は提示されません。では何が提示されるかというと、「行動の選択肢」と「報酬」になります。

強化学習においての報酬は「各行動」に対してではなく、「連続した行動の結果」に対して与えられるという点です。

サッカーでたとえると、ゴールをしたら1点、というのは強化学習における報酬になります。ただ、ゴールに至るためにパスをする、ドリブルをする、という各行動についてはいちいち報酬が与えられません。

逆に、コートの外から「今のパスはいいぞ!」「そこでドリブルしたらダメだろ!」と逐一指示が飛んでくるのが教師あり学習になります。強化学習では「連続した行動の結果」としてのゴールの1点しか報酬が与えられないため、それに至るためのパスやドリブルがどれぐらいいいのかは、ゴールできたケースとできなかったケースから、自分自身で「評価」を行っていく必要があります。

「4th STEP」では、「① 教師あり学習」と「② 教師なし学習」を取り上げます。

「③ 強化学習」は、複雑で様々な手法がありますので、省略します。興味のある方は、下記の参考を参照してください。

【参考】 ゼロからDeepまで学ぶ強化学習
  https://qiita.com/icoxfog417/items/242439ecd1a477ece312


【参考】 OpenAI Gym で自前の環境をつくる
  https://qiita.com/ohtaman/items/edcb3b0a2ff9d48a7def



コメント