
| 英文名 | Data Science Exercise | |
|---|---|---|
| 科目概要 | 未来工学研究科(修士課程)生命データサイエンス専攻修士1年前期、総合科目、選択、演習、1単位 |
|
| 科目責任者 | 齋藤 裕 | |
| 担当者 | (※は実務経験のある教員) 齋藤 裕、 |
|
| 講義室 | ||
本演習では、データサイエンスについて学部で学ぶ機会のなかった修士課程の学生を対象に、所属分野での研究等を円滑に進める上で必要となる基礎的な知識及びデータ解析の技術について、各種演習を通して修得することを目的とする。
基礎的な統計解析や機械学習などのデータ解析について学ぶとともに、公共データベースを用いた演習を行い実際の操作を学び、データサイエンスで必要となる技術を修得する。また、その上で必要となるプログラミング技術について、Pythonを用いて、プログラミングとはどんなものかのイメージを掴み、画面に文字を表示する簡単なプログラムを自分で書いてみる。変数と型、リストや辞書などのデータ構造、条件分岐、繰り返し処理、関数、ファイル入出力といったプログラミングの基礎について学ぶ。モジュールの使い方について学び、ファイル入出力、平均や分散などの計算を行う方法について学ぶ。また、対話的処理やバッチ処理などプログラムの様々な実行方法、クラウドやローカルなどのプログラミング環境について学ぶ。LinuxやMacなどのコマンドライン操作の基礎について学ぶ。これにより、今後、データサイエンス研究を進めていくための知識を養う。
パワーポイントによる講義の後、演習を行う。パワーポイント資料は講義前にホームページ等で配布する。毎回の講義では、理解度確認のために基礎的な内容の課題を出題する。また、数回の講義ごとに、応用的な内容のレポート課題を出題する。
なお、講義内課題、レポート課題については、提出後に模範解答を配布して解説を行う。
DP1、DP3
| 回 | 項目 | 内容 | 担当者 | 日時 |
|---|---|---|---|---|
| 1 | データサイエンスのためのプログラミング基礎1 |
データサイエンスにおいてプログラミングは必須の技術であるため、その基礎について学ぶ。はじめに、プログラミングとはどんなものかイメージを掴み、画面に文字を表示する簡単なプログラムを書いてみる。また、データを格納するための変数と型について学ぶ。 | 齋藤 裕 飯田 慎仁 来見田 遥一 |
4/8③ |
| 2 | データサイエンスのためのプログラミング基礎2 |
データサイエンスは多数のデータを扱う。それら多数のデータを扱うためのリストや辞書などのデータ構造について学ぶ。また、これらのデータを効率的に解析するための繰り返し処理や条件分岐について学ぶ。 | 齋藤 裕 飯田 慎仁 来見田 遥一 |
4/15③ |
| 3 | データサイエンスのためのプログラミング基礎3 |
データサイエンスにとって重要な要素となるデータ解析の手順を定義し、再利用するための仕組みである関数について学ぶ。組み込み関数の使い方や、自分で関数を定義する方法について学ぶ。 | 齋藤 裕 飯田 慎仁 来見田 遥一 |
4/22③ |
| 4 | データサイエンスのためのプログラミング基礎4 |
Pythonでは様々な関数がモジュールとして提供されており、これらを活用することで様々なデータ解析手法を実装できる。モジュールの使い方について学び、ファイルからデータを読み込む方法、ファイルにデータを書き込む方法について学ぶ。また、平均や分散などの計算を行う方法について学ぶ。 | 齋藤 裕 飯田 慎仁 来見田 遥一 |
5/13③ |
| 5 | 統計解析演習 | 公共データベースを用い、データの可視化、前処理、次元削減などの統計処理を行う方法について学ぶ。 | 齋藤 裕 飯田 慎仁 来見田 遥一 |
5/20③ |
| 6 | 機械学習演習 | 公共データベースを用い、初歩的な機械学習モデルを実装し、学習、評価、予測を行う方法について学ぶ。 | 齋藤 裕 飯田 慎仁 来見田 遥一 |
5/27③ |
| 7 | 対話的処理とバッチ処理、クラウド環境とローカル環境、コマンドライン操作 | 対話的処理やバッチ処理などプログラムの様々な実行方法について学ぶ。クラウドやローカルなどのプログラミング環境について学ぶ。LinuxやMacなどのコマンドライン操作の基礎について学ぶ。 | 齋藤 裕 飯田 慎仁 来見田 遥一 |
6/10③ |
| 8 | まとめ | 全体の確認と復習を行う。 | 齋藤 裕 飯田 慎仁 来見田 遥一 |
6/17③ |
実データを用いて初歩的な統計処理や機械学習などのデータ解析を行うことができる。プログラミングの基礎を理解でき、基本的なプログラムを書くことができる。
講義内で出題する課題(50%)、レポート課題(50%)の合計により評価する。
【講義時間外に必要な学修時間:29時間】
予習:事前に配布する講義資料を読み、疑問点を明確にしておくこと。講義資料内のソースコードを自分で実行して、動作を確認しておくこと。
復習:講義で扱ったソースコードを書き換え動作の変化を確認する等の練習を行い、今後、同様のソースコードを独力で書けるようにすること。レポート課題の解答を作成し、提出後に配布する模範解答との比較・考察を行うこと。
講義に関する質問はメールや対面にて受け付ける。
【関連科目:データサイエンス概論、機械学習プログラミング、最適化プログラミング】
| 種別 | 書名 | 著者・編者 | 発行所 |
|---|---|---|---|
| 教科書 | 配布資料あり | ||
| 参考書 | 東京大学のデータサイエンティスト育成講座 - Pythonで手を動かして学ぶデータ分析 | 塚本邦尊ら(著)、中山浩太郎(監) | マイナビ出版 |