本記事では、データサイエンスをゼロから始めたい人が、まずPython(パイソン)を勉強した方がよい理由と、勉強を始める注意点を説明します。
本記事の内容
・データサイエンスとは?
・Python(パイソン)とは?
・データサイエンス完全初心者がまずPython(パイソン)をやるべき3つの理由
・データサイエンスのためにPython(パイソン)を学ぶ時の注意点
・データサイエンス・Python(パイソン)ができるようになると
本記事の信頼性
・完全初心者からデータサイエンスとPythonをAidemyで1年以上勉強し、現在、本業でデータ分析案件に従事。
▶僕のAidemy(アイデミー)の実際の学習画面
人工知能特化型の学習サービス「Aidemy(アイデミー)」(外部リンク)
Aidemy(アイデミー)社の学習サイトから引用
データサイエンスとは?
世界トップクラスのデータサイエンティスト集団が設立したDataRobot社によると、次の通り定義されてます。
データサイエンスは分野の専門知識、プログラミングのスキル、数学および統計の知識を組み合わた研究分野であり、データから有意義なインサイトを引き出します。
DataRobot(データロボット)社のホームページより引用
つまり、データサイエンスとは、「専門知識×プログラミング×数学・統計を組み合わせた手法で、データから新しい発見を見つけよう」というものです。
・分野の専門知識:ビジネスや科学等の専門知識
・プログラミングのスキル:Python(パイソン)など
・数学および統計の知識:確率論、線形代数など
これが、最近ではビジネスにも取り入れようという動きがあり、話題になっています。
Python(パイソン)とは?
Pythonとはプログラミング言語の1つです。
Webサイト構築、機械学習、ゲーム開発、プログラミング教育、、、ととても守備範囲が広く万能な言語です。
実際にYoutube、Instagram、Twitterなどの様々なサービスでもPython(パイソン)は使われています。
Python(パイソン)には、多くの特徴がありますが、ここでは3つをピックアップします。
・少ないコードで簡潔にプログラムを書ける
・専門的なライブラリが豊富にある
・学習者・開発者が多く、プログラミングの情報が溢れている
少ないコードで簡潔にプログラムを書ける
「百聞は一見に如かず」ということで、実際にプログラミングコード(処理を指令する文)を比較してみます。
パソコンに「Hello, world!」と表示するプログラミングコードになります。
▶他のプログラミング言語(C言語)
#include <stdio.h>
int main(int argc, char *args[]){
printf("Hello, world!\n");
return 0;
}
▶Python(パイソン)
print('Hello World')
一目瞭然ですね。
これは手続き型プログラミング言語(命令を順にしっかり記載していくプログラミング言語)であるC言語との比較例ですが、Pythonはこんなにもシンプルで少ない記述で書けます。
専門的なライブラリが豊富にある
Python(パイソン)には、初めから用意してある機能・処理(ライブラリ)が豊富にあります。
なので、ゼロから自分で処理を書かなくてもいいのです。
例えば、回帰分析をするときは、あらかじめ用意された「LinearRegression()」というモノを使うだけで、次のように2行で書けてしまうんです。
model = LinearRegression()
model.fit(train_X, train_y)
Python(パイソン)には、こんな感じで初めから準備されたものがたくさんあるので、使いやすく万能に活用できるのです。
学習者・開発者が多く、プログラミングの情報が溢れている
海外のエンジニア調査会社大手のRedMonkのプログラミング言語ランキング(2020年2月28日公表)によると、Python(パイソン)は、人気第2位となっております。
ウェブサイトを作るときのほぼ必須であるJavascriptは抜けないまでも、ここまで伸びるのは世界中で汎用的に使われている表れです。
そして人気である分、Python(パイソン)のプログラミングの書き方、エラー解決方法などに関する情報も山ほどあります。
そういった意味でもPython(パイソン)はプログラミング完全初心者であっても取っつきやすい言語です。
データサイエンス完全初心者がまずPython(パイソン)をやるべき3つの理由
それでは、これからデータサイエンスを勉強しようとする人が、プログラミング言語としてPythonを勉強すべき理由を紹介します。
・データサイエンスで使うデータ分析・機械学習のライブラリが豊富
・プログラミング完全初心者でも分かりやすいプログラミング言語
・データサイエンスの求人・仕事案件の数が多い
データサイエンスで使うデータ分析・機械学習のライブラリが豊富
他の言語と比べ、Python(パイソン)はデータサイエンス、機械学習に関するライブラリも圧倒的に多いです。
先ほどの例で示した回帰分析はあくまで一例で、実際は、次のようにデータサイエンスで利用する機能・処理をほとんど網羅しています。
・スクレイピング(データ収集)
・データクレンジング(データ前処理)
・学習モデル(教師あり学習、教師なし学習、強化学習)の適用
・自然言語処理
・画像認識
など
他のプログラミング言語でも勿論これらの処理自体は可能ですが、Python(パイソン)ではよりシンプルに分かりやすく記述することができます。
プログラミング完全初心者でも分かりやすいプログラミング言語
問題です。
次のPython(パイソン)のプログラムコードは何をしているか分かりますか?
money = 200
apple_price = 100
if money >= apple_price:
print('りんごを買うことができます')
else:
print('お金が足りません')
そうです。
ご想像のとおり、手持ち金額とりんごの値段を比較し、買えるかを判断しているんです。
このように、Python(パイソン)は、完全初心者でも何となく単語(キーワード)を読むことで処理の内容が想像できるのです。
データサイエンスの求人・仕事案件の数が多い
AI・データ分析特化型の求人・案件紹介サイト「BIGDATA NAVI」によると、掲載している全案件数618件のうち、210件(約3分の1)がPython(パイソン)を使うものです。(2020年5月1日時点)
他の言語と比べてダントツ1位です。
この通り、データサイエンスを軸に仕事をするとした場合、Python(パイソン)は必須のプログラミング言語と言えるでしょう。
データサイエンスのためにPython(パイソン)を学ぶ時の注意点
あなたは、ここまで聞いてすぐにでもPython(パイソン)を勉強してみたいとなったでしょう。
ただ、ここで焦らず一息ついてください。
やり方を間違えると、数カ月ほど時間を無駄にすることになります。
Python(パイソン)は、いくら初心者向けといい、プログラミング言語である以上、挫折率もかなり高いです。
そして、最初に誤った方法で勉強し始めても、変な癖がついて逆にマイナスの方向に進むかもしれません。
なので、次の理由からPython(パイソン)を勉強する前にまずは、データサイエンス・Python(パイソン)をやっている人に相談することを強くおすすめします。
・自分だけの考えは危険
・勉強を始めて分からないことが聞きやすくなる
・相談することで、勉強のモチベーションになる
自分だけの考えは危険
「データサイエンスを勉強して、データサイエンティストになり高単価案件の仕事をしたい。だから、まずはPython」
みんなそう思います。
ただ、現実は、データサイエンスの勉強内容は深く、広く、実務でも泥臭い仕事が多いです。
そもそも論として、ぜひ自分の頭の中にあるデータサイエンティストのイメージと、現実の仕事がずれてないかを第三者に聞くのがベストです。
もしかしたら、自分の考え・イメージとかけ離れているかもしれません。
勉強を始めて分からないことが聞きやすくなる
世の中には、多くのデータサイエンス・Python(パイソン)の無料教材、動画があふれています。
ただ、これらはほとんどがインプットです。インプットをすると必ず疑問が生れます。
そしてググっても、双方向のやりとりでないため、何となくしか分かりません。
そういったときに、周りの誰かに相談できる人がいると学習効率が断然上がります。
ぜひ、他の人に相談すること、その後の聞きやすい環境作りの伏線を敷いておきましょう。
相談することで、勉強のモチベーションになる
僕の経験上からも一度誰かに相談すると、モチベーションが倍増します。
相談してもらったからには、自分も途中でやめられないといった感情になるのです。
そして、その相談してもらった人と触れ合うたびに頑張ろうという気持ちが芽生えます。
モチベーションの維持は不可欠なので、ぜひぜひ活用します。
そもそも周りにデータサイエンス・Python(パイソン)を相談する人がいない
相談することのメリットをつらつらと言ってきましたが、周りに相談相手がいないという人がほとんどかもしれません。
そんな人のための次の記事を書いておりますので、よかったら参考にしてください。
参考Pythonはまず相談・体験してから勉強すべき【90%挫折します】
データサイエンス・Python(パイソン)ができるようになると
最後に、モチベーションアップのために、データサイエンティスト・Python(パイソン)ができるようになると、実現できることを1つ紹介します。
・フリーランスで働けるようになります。
そして、月70万円の高単価案件も。
AI・データ分析特化型の求人・案件紹介サイト「BIGDATA NAVI」より引用
今後、日本では経済産業省の「デジタルトランスフォーメーション(DX)」という取り組みもあり、国主導で「データサイエンス領域・市場が拡大する」ことが見込まれてます。
参考経済産業省DXレポート(2018年9月)(経済産業省HPへのリンク)
データサイエンス人材はより重宝され、案件単価ももっと上がるでしょう。
【まとめ】データサイエンスにはPython(パイソン)がおすすめ。将来も明るい。
ここまで読んで頂き、ありがとうございます。
まとめると、こんな感じです。
・データサイエンスにはPython(パイソン)がおすすめ。(個人的には必須!)
・データサイエンス・Python(パイソン)を勉強する前に、周りの人に相談を
・データサイエンスの領域は、国指導で今後も伸びると見込まれる
ぜひぜひ、時代の流れを先取りするためにも今のうちに、データサイエンス・Python(パイソン)を勉強しておきましょう。
以上となります。ありがとうございました。
早速、Pythonを始めてみたい