Web Syllabus(講義概要)
トップへ戻る 前のページへ戻る
データモデリング演習
英文名 Data Modelling
科目概要 データサイエンス学科3年後期、3群科目、選択、演習、2単位
科目責任者  島津 秀康
担当者 (※は実務経験のある教員) 島津 秀康※力丸 佑紀※ウ・ニクハン
講義室

教員免許取得のための必修科目

科目 教科及び教科の指導法に関する科目(高等学校 情報)
各科目に含めることが必要な事項
  • 教科に関する専門的事項 コンピュータ・情報処理

授業の目的

データ解析とその数理I及びIIで学んだ内容を踏まえ、諸科学分野で観察・観測されるデータについて、決定論的、確率論的モデルを自由に扱い、現象に肉薄するモデル構築の技術を実学を通じて習得する。今後、データサイエンティストはチームワークの素養が益々重要となることから、グループでの演習活動中心に行い、モデルを通して得た新たな知見を如何にして周りの人に伝え共有するか、実際現場の問題解決に活かせるかを学ぶ。

教育内容

およそ5回を1プロジェクトとしてグループごとにデータ解析にあたり、モデルを構築する。各プロジェクトではデータ解析からモデリングとその評価までの一連の流れ:
• データの取得・記述、クリーニング
• データから傾向の探索
• モデルの構築、検証と改良
• 新たに得られた知見の理解と現場への還元
を意識し、グループ内での活発な議論を通して理解の深化をはかる。

各プロジェクトでは、以下のような学際的なデータ駆動型のテーマを設定する:
• 特定滞空時間の紙プロペラの設計(品質管理)
• 病院での救急搬送患者到着時間帯パターンを反映したスタッフ最適配置問題
• 特定疾病の地図上での集積性の検出
• 温暖化と生物成長パターン変化の関連性の探索
• 海洋保護区設定の有効性の検証
• 新教材を用いた教育効果の測定と検証 など

教育方法

プロジェクト開始時に問題背景と設定を解説し、問題の難易度に応じて適宜inductive tasksを段階的に設定しプロジェクトが円滑に進行するようにする。プロジェクトの成果発表を通じてグループ間でお互いに異なるアプローチについて意見交換を行い、「モデル」と「視点」の関係を重視し、画一的な手法の適用の難点にも焦点を当てる。主にデータ解析言語Rを用いる。
講義中の課題についての重要なコメントは受講者全員で共有する。講義に関する時間外での質問はイントラネット上で対応し、受講者全員で共有する。

卒業・学位授与の方針と当該科目の関連

DP4

授業内容(シラバス)

項目 内容 担当者 日時
1 Project X 問題の背景と設定 プロジェクトの問題背景と設定を理解する 島津 秀康
9/10②
2 Project X データの探索 探索的データの解析からモデル構築の方針を立てる 島津 秀康
9/17②
3 Project X モデル構築 モデルの妥当性を検討しながらモデルの改良を重ねる 島津 秀康
9/24②
4 Project X 結果の吟味 グループ内で結果をまとめ発表の準備を進める 島津 秀康
10/1②
5 Project X グループ成果発表 グループごとにプロジェクトの成果を発表し、お互いに意見を交換し合い、プロジェクトのまとめを行い、理解を確認する 島津 秀康
力丸 佑紀
ウ・ニクハン
10/8②
6 Project Y 問題の背景と設定 プロジェクトの問題背景と設定を理解する 力丸 佑紀
10/15②
7 Project Y データの探索 探索的データの解析からモデル構築の方針を立てる 力丸 佑紀
10/22②
8 Project Y モデル構築 モデルの妥当性を検討しながらモデルの改良を重ねる 力丸 佑紀
10/29②
9 Project Y 結果の吟味 グループ内で結果をまとめ発表の準備を進める 力丸 佑紀
11/5②
10 Project Y グループ成果発表 グループごとにプロジェクトの成果を発表し、お互いに意見を交換し合い、プロジェクトのまとめを行い、理解を確認する 島津 秀康
力丸 佑紀
ウ・ニクハン
11/19②
11 Project Z 問題の背景と設定 プロジェクトの問題背景と設定を理解する 島津 秀康
ウ・ニクハン
11/26②
12 Project Z データの探索 探索的データの解析からモデル構築の方針を立てる 島津 秀康
ウ・ニクハン
12/3②
13 Project Z モデル構築 モデルの妥当性を検討しながらモデルの改良を重ねる 島津 秀康
ウ・ニクハン
12/10②
14 Project Z 結果の吟味 グループ内で結果をまとめ発表の準備を進める 島津 秀康
ウ・ニクハン
12/15②
15 Project Z グループ成果発表 グループごとにプロジェクトの成果を発表し、お互いに意見を交換し合い、プロジェクトのまとめを行い、理解を確認する 島津 秀康
力丸 佑紀
ウ・ニクハン
12/24②
No. 1
項目
Project X 問題の背景と設定
内容
プロジェクトの問題背景と設定を理解する
担当者
島津 秀康
日時
9/10②
No. 2
項目
Project X データの探索
内容
探索的データの解析からモデル構築の方針を立てる
担当者
島津 秀康
日時
9/17②
No. 3
項目
Project X モデル構築
内容
モデルの妥当性を検討しながらモデルの改良を重ねる
担当者
島津 秀康
日時
9/24②
No. 4
項目
Project X 結果の吟味
内容
グループ内で結果をまとめ発表の準備を進める
担当者
島津 秀康
日時
10/1②
No. 5
項目
Project X グループ成果発表
内容
グループごとにプロジェクトの成果を発表し、お互いに意見を交換し合い、プロジェクトのまとめを行い、理解を確認する
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
10/8②
No. 6
項目
Project Y 問題の背景と設定
内容
プロジェクトの問題背景と設定を理解する
担当者
力丸 佑紀
日時
10/15②
No. 7
項目
Project Y データの探索
内容
探索的データの解析からモデル構築の方針を立てる
担当者
力丸 佑紀
日時
10/22②
No. 8
項目
Project Y モデル構築
内容
モデルの妥当性を検討しながらモデルの改良を重ねる
担当者
力丸 佑紀
日時
10/29②
No. 9
項目
Project Y 結果の吟味
内容
グループ内で結果をまとめ発表の準備を進める
担当者
力丸 佑紀
日時
11/5②
No. 10
項目
Project Y グループ成果発表
内容
グループごとにプロジェクトの成果を発表し、お互いに意見を交換し合い、プロジェクトのまとめを行い、理解を確認する
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
11/19②
No. 11
項目
Project Z 問題の背景と設定
内容
プロジェクトの問題背景と設定を理解する
担当者
島津 秀康
ウ・ニクハン
日時
11/26②
No. 12
項目
Project Z データの探索
内容
探索的データの解析からモデル構築の方針を立てる
担当者
島津 秀康
ウ・ニクハン
日時
12/3②
No. 13
項目
Project Z モデル構築
内容
モデルの妥当性を検討しながらモデルの改良を重ねる
担当者
島津 秀康
ウ・ニクハン
日時
12/10②
No. 14
項目
Project Z 結果の吟味
内容
グループ内で結果をまとめ発表の準備を進める
担当者
島津 秀康
ウ・ニクハン
日時
12/15②
No. 15
項目
Project Z グループ成果発表
内容
グループごとにプロジェクトの成果を発表し、お互いに意見を交換し合い、プロジェクトのまとめを行い、理解を確認する
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
12/24②

到達目標

同じデータであっても異なる視点からは異なるモデルが構築できること、言い換えれば、異なるモデルは異なる視点・解釈を与えることを学び、多様な視点からモデルの価値を評価できるようになる。

評価方法

演習内での課題(60%)とレポート(40%)の結果から総合的に評価する。

準備学習(予習・復習等)

【講義時間外に必要な学修時間:60時間】
予習:あらかじめ指定されたプロジェクトの遂行に必要となる1‐2年次科目の内容を復習し、テーマの当該分野について調べておくこと。
復習:プロジェクトの締切りに合わせ、時間内に終了しなかった演習課題に取り組む。

備考・その他

【科目ナンバリング:FU302-DM03】
【関連科目:確率の数理、データ解析とその数理Ⅰ・Ⅱ、人工知能・機械学習入門】

実務経験の授業への活用方法

(島津)政府研究所でのデータ解析とモデリング研究経験をもとに解説を行う。
(力丸)研究所でのデータ解析経験をもとに、データの取得と適切な記述について解説を行う。
(ウ)国立研究所でのリスク因子に関するモデリング研究経験をもとに解説を行う。

教材

種別 書名 著者・編者 発行所
教科書 (なし)
参考書 Sと統計モデル J.M. チェンバース, T.J. ヘイスティ(編集) 柴田里程(訳) 共立出版
参考書 Statistical Modelling in R Murray Aitkin, Brian Francis, John Hinde and Ross Darnell Oxford University Press
教科書
書名
著者・編者
発行所
参考書
書名
Sと統計モデル
著者・編者
J.M. チェンバース, T.J. ヘイスティ(編集) 柴田里程(訳)
発行所
共立出版
参考書
書名
Statistical Modelling in R
著者・編者
Murray Aitkin, Brian Francis, John Hinde and Ross Darnell
発行所
Oxford University Press