Translate

#45 Section 1 機械学習がもたらすもの

今まで、「ビッグデータの読み込みとデータの確認」、「集計とグラフ描画」、オープンデータのWebスクレイピングやデータ整形を学ぶための「応用編 医療」を学習してきたみなさま。

ここからは、いよいよ4th STEP 機械学習に進んでいきます。



どのような機械学習を選択してデータ解析すればよいか提案ができること、そしてそのコードを書けることにより、データサイエンティストとしてかなり有利な条件でのリスキリングが可能となります。

→ スライドは、クリックすると拡大できます!



Section 1 機械学習がもたらすもの




4th STEPの学習を始める前に、なぜ機械学習を学ばなくてはならないかを理解するために、データを知識・知恵に変えるためのフレームワークである「DIKWモデル」について説明します。




DIKWモデルでは、データサイエンスのステップをデータ情報知識知恵の4つに分類します。

具体的に、ある学級のテストの点数に関して説明していきます。

①データ:1学期中間試験のテストの答案用紙の束のように、単なる数字や記号の集まりをデータと呼びます。




②情報:①のデータをDataFrameやEcelにまとめ、合計点や偏差値などのその他の要約統計量を求めたものを「②情報」と呼びます。グラフを描き、わかりやすく可視化することもあります。今までのデータサイエンス チュートリアルはここまで対象として学んできました。




③知識:さらにデータが増えて、1学期期末試験、2学期中間試験などのデータが入手できると、どのような事を考えるでしょうか?個々に3学期の期末試験の点数を予測したり、テストの結果を元に、文系に進学した方がよいのか、それとも理系の方がよいのか、知りたいと思うことでしょう。情報から規則性や見解などを導き出したものを「③知識」と呼び、機械学習や深層学習という手法が必要となってきます。






④知恵:深い知識が豊富にあり、様々な問題に直面した時に発揮される問題解決能力や発想力を「④知恵」と呼びます。ちなみに、人間と同レベルの、あるいはそれを超える知恵を持つAIを「強いAI」と呼びますが、これはまだ実現していませんので、知恵は人間のみが持っているものです。




以上まとめると、前のスライドに戻って、このようになります。別の例も示しておきました。




このようにデータを知識・知恵に変えるためのフレームワーク「DIKWモデル」でデータ分析を見ていくと、データ分析はステップを踏みながら知識・知恵を深めていくことがわかります。いきなり、優れた知恵にたどり着くわけではありません。

お偉方が「データが山ほどあるのだから、データサイエンティストに何か分析してもらえ!」というような昭和の時代の業務命令が意味をなさないことがよくわかると思います。このような時は、何か行き詰っているのだなあ~と、やり過ごすことが一番です。これが、知恵です。


コメント