英文名 | Data Modelling | |
---|---|---|
科目概要 | データサイエンス学科3年後期、3群科目、選択、演習、2単位 | |
科目責任者 | 島津 秀康 | |
担当者 | (※は実務経験のある教員) 島津 秀康※、 力丸 佑紀※、 ウ・ニクハン | |
講義室 |
科目 | 教科及び教科の指導法に関する科目(高等学校 情報) |
---|---|
各科目に含めることが必要な事項 |
|
データ解析とその数理I及びIIで学んだ内容を踏まえ、諸科学分野で観察・観測されるデータについて、決定論的、確率論的モデルを自由に扱い、現象に肉薄するモデル構築の技術を実学を通じて習得する。今後、データサイエンティストはチームワークの素養が益々重要となることから、グループでの演習活動中心に行い、モデルを通して得た新たな知見を如何にして周りの人に伝え共有するか、実際現場の問題解決に活かせるかを学ぶ。
およそ5回を1プロジェクトとしてグループごとにデータ解析にあたり、モデルを構築する。各プロジェクトではデータ解析からモデリングとその評価までの一連の流れ:
• データの取得・記述、クリーニング
• データから傾向の探索
• モデルの構築、検証と改良
• 新たに得られた知見の理解と現場への還元
を意識し、グループ内での活発な議論を通して理解の深化をはかる。
各プロジェクトでは、以下のような学際的なデータ駆動型のテーマを設定する:
• 特定滞空時間の紙プロペラの設計(品質管理)
• 病院での救急搬送患者到着時間帯パターンを反映したスタッフ最適配置問題
• 特定疾病の地図上での集積性の検出
• 温暖化と生物成長パターン変化の関連性の探索
• 海洋保護区設定の有効性の検証
• 新教材を用いた教育効果の測定と検証 など
プロジェクト開始時に問題背景と設定を解説し、問題の難易度に応じて適宜inductive tasksを段階的に設定しプロジェクトが円滑に進行するようにする。プロジェクトの成果発表を通じてグループ間でお互いに異なるアプローチについて意見交換を行い、「モデル」と「視点」の関係を重視し、画一的な手法の適用の難点にも焦点を当てる。主にデータ解析言語Rを用いる。
講義中の課題についての重要なコメントは受講者全員で共有する。講義に関する時間外での質問はイントラネット上で対応し、受講者全員で共有する。
DP4
回 | 項目 | 内容 | 担当者 | 日時 |
---|---|---|---|---|
1 | Project X 問題の背景と設定 | プロジェクトの問題背景と設定を理解する | 島津 秀康 | 9/18② |
2 | Project X データの探索 | 探索的データの解析からモデル構築の方針を立てる | 島津 秀康 | 9/25② |
3 | Project X モデル構築 | モデルの妥当性を検討しながらモデルの改良を重ねる | 島津 秀康 | 9/30② |
4 | Project X 結果の吟味 | グループ内で結果をまとめ発表の準備を進める | 島津 秀康 | 10/2② |
5 | Project X グループ成果発表 | グループごとにプロジェクトの成果を発表し、お互いに意見を交換し合い、プロジェクトのまとめを行い、理解を確認する | 島津 秀康 力丸 佑紀 ウ・ニクハン | 10/9② |
6 | Project Y 問題の背景と設定 | プロジェクトの問題背景と設定を理解する | 力丸 佑紀 | 10/16② |
7 | Project Y データの探索 | 探索的データの解析からモデル構築の方針を立てる | 力丸 佑紀 | 10/23② |
8 | Project Y モデル構築 | モデルの妥当性を検討しながらモデルの改良を重ねる | 力丸 佑紀 | 10/30② |
9 | Project Y 結果の吟味 | グループ内で結果をまとめ発表の準備を進める | 力丸 佑紀 | 11/6② |
10 | Project Y グループ成果発表 | グループごとにプロジェクトの成果を発表し、お互いに意見を交換し合い、プロジェクトのまとめを行い、理解を確認する | 島津 秀康 力丸 佑紀 ウ・ニクハン | 11/13② |
11 | Project Z 問題の背景と設定 | プロジェクトの問題背景と設定を理解する | 島津 秀康 ウ・ニクハン | 11/20② |
12 | Project Z データの探索 | 探索的データの解析からモデル構築の方針を立てる | 島津 秀康 ウ・ニクハン | 11/27② |
13 | Project Z モデル構築 | モデルの妥当性を検討しながらモデルの改良を重ねる | 島津 秀康 ウ・ニクハン | 12/4② |
14 | Project Z 結果の吟味 | グループ内で結果をまとめ発表の準備を進める | 島津 秀康 ウ・ニクハン | 12/11② |
15 | Project Z グループ成果発表 | グループごとにプロジェクトの成果を発表し、お互いに意見を交換し合い、プロジェクトのまとめを行い、理解を確認する | 島津 秀康 力丸 佑紀 ウ・ニクハン | 12/17③ |
同じデータであっても異なる視点からは異なるモデルが構築できること、言い換えれば、異なるモデルは異なる視点・解釈を与えることを学び、多様な視点からモデルの価値を評価できるようになる。
演習内での課題(60%)とレポート(40%)の結果から総合的に評価する。
【講義時間外に必要な学修時間:60時間】
予習:あらかじめ指定されたプロジェクトの遂行に必要となる1‐2年次科目の内容を復習し、テーマの当該分野について調べておくこと。
復習:プロジェクトの締切りに合わせ、時間内に終了しなかった演習課題に取り組む。
【科目ナンバリング:FU302-DM03】
【関連科目:確率の数理、データ解析とその数理Ⅰ・Ⅱ、人工知能・機械学習入門】
(島津)政府研究所でのデータ解析とモデリング研究経験をもとに解説を行う。
(力丸)研究所でのデータ解析経験をもとに、データの取得と適切な記述について解説を行う。
種別 | 書名 | 著者・編者 | 発行所 |
---|---|---|---|
教科書 | (なし) | ||
参考書 | Sと統計モデル | J.M. チェンバース, T.J. ヘイスティ(編集) 柴田里程(訳) | 共立出版 |
参考書 | Statistical Modelling in R | Murray Aitkin, Brian Francis, John Hinde and Ross Darnell | Oxford University Press |