データサイエンス初心者が挑戦!東京大学の講座GCIを受けてみた! | AIZINE(エーアイジン)
教育

データサイエンス初心者が挑戦!東京大学の講座GCIを受けてみた!

データ分析をイメージ

AI(人工知能)という言葉を見かけるようになる中、同時注目されるようになってきたデータサイエンス。なんとなくかっこよさそうに聞こえたりAI(人工知能)と関係がありそうに見えるけどその実体はよくわからないですよね。

そのデータサイエンスの基本的な内容を体系的に学び実践レベルを目指せる講座があります。

中村
中村

それは東京大学が開催するデータサイエンス講座GCIです。

私は去年の12月から今年の3月までにかけてこの講座を受講し無事終えることができました。

今回はその講座がどのようなものであるかや自分がどう成長していったかをお伝えしていきます。それでは、そもそもデータサイエンス講座GCIとは何かから始めていきましょう。

東京大学開催のデータサイエンス講座GCIとは

講座のイメージ

まずGCIとは東京大学グローバル消費インテリジェンス寄付講座(Chair for Global Consumer for Intelligence)の略称。

このグローバル消費インテリジェンス寄付講座が目指しているのは、高い消費インテリジェンスを世界規模で活かしていける人材の育成です。

ここで言う消費インテリジェンスとはデータ分析を通して消費者について様々な視点から理解する能力のこと。日を追うごとに消費をめぐるデータが世界規模で急激に増加しており消費者や生活者の理解に繋げられる能力への需要が高まっているとしています。
この問題意識と向き合うために東京大学にプラットフォームを作り、人材育成や学問分野の確立を急速に進めていく中の一つとして、今回受講したデータサイエンスの講座が実施されているのです。

今回、私が受講したものはGCIデータサイエンス育成講座というもの。

受講した当時既に東京大学内で6期、オンラインで3期が行われており、東大生と社会人で合わせて1,300人以上にデータサイエンスの基礎や機械学習を学ぶ機会を提供していました。そして私が受講したのはオンラインで4期目。今回は初の試みとして東大生向けに開催するオフラインでの講座と同期して実施していました。

さて、受講費用がいくらになるか気になりますよね。なんと受講費用は無料。そしてブラウザ上からアクセスできる開発環境も用意されていたので普段のネット環境だけで集中的に学習を進めていくことができたのも魅力的な点です。

受講のきっかけと当時のレベル

勉強をイメージ

ここまではGCIについて触れていったので、今回の講座を受講することになったきっかけと当時のレベルについてお話します。

中村
中村

そもそも私は学生時代に在籍していた学部でプログラミングの授業はあったものの、他の学生さんに助けてもらいながらギリギリ単位が取れるくらいの状態。サークルでは三味線に打ち込んでいたためデータサイエンスどころかAI(人工知能)とほぼ無縁でした。

大学を卒業してからはとある本に載せる広告枠の営業職として就職するも諸事情で退職。将来について模索していました。そんな中で、たまたまAI(人工知能)の本を読んでPythonにも興味を持つことに。そしてPaizaラーニングなどで最低限文法を学び、ブログサイトを参考にe-Sportsのデータセットの分析をしたり、AI(人工知能)のようなものを作ったりはしていました。
でも実際は思いついたことを検索し見様見真似で取り組むのに留まっていたので何がわかっていて何がわかってないのかがわかってない状態。素人レベルであることは間違いないもののどこから手を付けていけばいいのか困っていました。
中村
中村

そこで基本的な内容を体系的に学習できるセミナーがないかネット上で探していたら運よくこの講座を見つけ、ダメもとで試験を受けたら結果は合格。講座のSlackに加入し受講に至ったのです。

データサイエンス講座GCIの仕組みと気になる修了条件

講座のイメージ

それでは今度は具体的な仕組みと修了条件についてお話していきましょう。

私が受講していたのは社会人向けのオンラインコース。主催者側が用意した教材をほぼ毎週配布され、それに沿って学習を進めていました。受講した際に使用した教材は松尾研究室のページで無償公開されているもの。また、「東京大学のデータサイエンティスト育成講座 Pythonで手を動かして学ぶデ—タ分析」という本では講座で使われている資料がベースとなっています。
社会人向けのオンラインコースではパソコン上でそれぞれの都合に合わせて教材を動かしたり課題を行っていました。東大生向けの方では講義も行われており、講師から許可が出た場合に限りその時の様子をSlackで視聴できる場合も。

全体での受講生は900人以上で医者やコンサルなど様々なバックグラウンドを持った方が集まっていました。

そして修了するための気になる条件は以下の通り。
  • 講義資料ごとに出される課題を期限までに提出し最終期限までに全て正解させること
  • 指定されたKaggleというデータサイエンスのサイトの形式に沿ったコンペで解答を出し回によっては指定された条件を達成すること
  • 最終課題を提出し受理されること
課題の数は決して少なくはなく、一人だけだとうまくいかない点やわからない点が出てきますよね。そういう時は受講者同士でディスカッションをし、それぞれで問題を解決し合える環境がSlackのチャンネルで用意されていました。
また、定期的にもくもく回という形で東京大学に集まり受講生同士やTA(ティーチング・アシスタント)さんと直接質問しあえる機会も。

さらに、今回新型コロナウィルスで延期になってしまいましたが、修了者向けにイベントも用意されており、データサイエンスについて学ぶという同じ志を持った人同士のコミュニティとなっておりそういった勉強をするのにまたとない環境でした。

受講してできるようになったこと

Go up and never stop

こうして、GCIに受講したことでできるようになったことがありました。

  1. 初めにまず挙げられるのは講座を通して与えられたデータセットから課題を見つけ、何をどうすればいいかといった段取りを考えることができるようになったこと。
  2. また、これから自分で勉強していく課題として数学や統計学をもう一度復習し、機械学習の理論を理解する足掛かりとしていく必要性がわかりました。
今まではKaggleからデータセットをダウンロードしプログラミングの練習に使うので終わっていましたが、どのようなステップを踏んでいけばよいかがわかったのでコンペにも挑戦してみようという気持ちを持てるようにもなりました。
中村
中村

講座を通してデータサイエンスを本格的に学ぶ第一歩を踏み出すことができたので、コンペに参加するのはもちろん、実際にデータを分析して可視化したり現状をよりよくするための提案ができるようこれからも勉強を続けていきたいです。

 

卒業のイメージ

今回は去年の12月から今年の3月にかけて受講したデータサイエンス講座GCIがどのようなものであるかや受講のきっかけ、自分がどう成長していったかをお伝えしました。

この講座を通してデータサイエンスの基礎を体系的に学習できただけでなく今後の課題が見つかったりモチベーションに繋がったので大変感謝しています。
講座で使用している教材は書籍や松尾研究室のサイトから入手できるので興味のある方は是非取り組んでみてください。 データサイエンスについて学習したいという人達が切磋琢磨し、初心者からでも実践レベルまで目指せるまたとない環境なのでチャンスがあれば申し込むのもおすすめです。

この講座をきっかけに多くの方がデータサイエンスに興味を持ったり勉強することを通して仕事や日常生活に役立てられるといいですよね。

トップへ戻る
タイトルとURLをコピーしました