【参考】データサイエンスのためのプログラム言語
データサイエンスを身に付けるためには、データ分析を自らが行うことが大切です。理論を学ぶだけでは理解することが難しいですし、なにより目の前のデータを自分で分析して、自分なりの仮説を立てることはとても楽しいことです。
その際に、どのプログラム言語から学ぶのか、迷ってしまうことがあるでしょう。
個人的に学ぶ場合は、導入費用も気になるところです。
先ずは、どのようなプログラム言語があるのかを見てみましょう。
Python、R、S、SAS、SQL、Java、MATLAB、最近ではJulia、Scalaなどがあります。それぞれの概要は、下記を参照してみてください。
■ データサイエンティストが学ぶべきプログラミング言語
https://goworkship.com/magazine/data-scientist-programming/
https://goworkship.com/magazine/data-scientist-programming/
様々なものがあるのですが、現在、Pythonがデータサイエンスのためのプログラミング言語の中では最も人気が高い言語です。まずは、Pythonから始めるという選択が今の標準だと思います。データを集計したり、グラフを描いたりといった基本的なことから、機械学習まで幅広いスキルアップに対応しています。また、無料で使うことができます。
Pythonの特徴は、下記を下記を参照してみてください。
https://www.agaroot.jp/datascience/column/python/
ちなみに、私はSから始めましたが、それはSをエンジンとし、GUIが優れた「Visual Mining Studio」というパッケージと出会ったからでした。汚いデータの前処理や分析メニュー選択がクリック&ドラッグで行えることが選んだ理由です。また、営業のTさんが高校の後輩だったり、開発者のJさんが私のような初心者の要望を取り入れ開発してくれたという人間関係も大きな理由となっています。
今は、よっぽどの人間関係がない限り、Pythonから始めましょう!
コメント
コメントを投稿