#45 Section 1 機械学習がもたらすもの
今まで、「ビッグデータの読み込みとデータの確認」、「集計とグラフ描画」、オープンデータのWebスクレイピングやデータ整形を学ぶための「応用編 医療」を学習してきたみなさま。
ここからは、いよいよ4th STEP 機械学習に進んでいきます。
→ スライドは、クリックすると拡大できます!
Section 1 機械学習がもたらすもの
4th STEPの学習を始める前に、なぜ機械学習を学ばなくてはならないかを理解するために、データを知識・知恵に変えるためのフレームワークである「DIKWモデル」について説明します。
DIKWモデルでは、データサイエンスのステップをデータ、情報、知識、知恵の4つに分類します。
具体的に、ある学級のテストの点数に関して説明していきます。
①データ:1学期中間試験のテストの答案用紙の束のように、単なる数字や記号の集まりをデータと呼びます。
②情報:①のデータをDataFrameやEcelにまとめ、合計点や偏差値などのその他の要約統計量を求めたものを「②情報」と呼びます。グラフを描き、わかりやすく可視化することもあります。今までのデータサイエンス チュートリアルはここまで対象として学んできました。
③知識:さらにデータが増えて、1学期期末試験、2学期中間試験などのデータが入手できると、どのような事を考えるでしょうか?個々に3学期の期末試験の点数を予測したり、テストの結果を元に、文系に進学した方がよいのか、それとも理系の方がよいのか、知りたいと思うことでしょう。情報から規則性や見解などを導き出したものを「③知識」と呼び、機械学習や深層学習という手法が必要となってきます。
④知恵:深い知識が豊富にあり、様々な問題に直面した時に発揮される問題解決能力や発想力を「④知恵」と呼びます。ちなみに、人間と同レベルの、あるいはそれを超える知恵を持つAIを「強いAI」と呼びますが、これはまだ実現していませんので、知恵は人間のみが持っているものです。
コメント
コメントを投稿