Web Syllabus(講義概要)
トップへ戻る 前のページへ戻る
データモデリング特論
英文名Advanced Data Modelling
科目概要未来工学研究科(修士課程)生命データサイエンス専攻修士1年前期、専門科目、選択、講義、2単位
科目責任者 島津 秀康
担当者(※は実務経験のある教員) 島津 秀康力丸 佑紀
講義室

授業の目的

データサイエンスの背景を持たない学生を念頭に学部で学ぶ微積分、線形代数、確率の主要な概念をより一般的な枠組みで整理し、データ解析及びモデリングで果たす役割の理解を助ける。諸科学分野で観察・観測されるデータについて決定論的、確率論的モデルを自由に扱い、現象に肉薄するモデル構築、その適切性について評価や解釈ができるようになることを目的とする。

教育内容

線形空間での射影や次元といった基礎概念と線形モデル、微分方程式や確率過程に代表される非線形モデルについて、モデルの探索、構築、推定、評価について学ぶ。とりわけ推定量に関する諸概念と最尤原理から導かれる推測理論がモデル評価で果たす役割を理解する。

教育方法

データ解析の数理的背景を講義しながら、実データ解析の演習を取入れ実践的理解も深める。演習活動を通して「モデル」と「視点」の関係を重視し、画一的な手法の適用の難点にも焦点を当てる。主にデータ解析言語Rを用いる。
講義中の課題についての重要なコメントは受講者全員で共有する。

卒業・学位授与の方針と当該科目の関連

DP2

授業内容(シラバス)

項目内容担当者日時
1データ行列データの取得と記述、変量と記録、データテーブルと型、データクリーニング、データ行列の線形演算(平均、分散、中心化など)。島津 秀康
力丸 佑紀
4/7②
2データの探索データの雲の中でデータ間の距離の概念(ノルム)、
座標軸の張替えの概念(特異値分解)について学び、均質性を探るアプローチを実践する。
島津 秀康
力丸 佑紀
4/14②
3線形モデル1直交射影による最小二乗法の実現をデータ解析での実践を通して学び、モデルが説明し残した残差の検証方法について、視覚的にモデルの妥当性を検討する。島津 秀康
力丸 佑紀
4/21②
4線形モデル2カテゴリカルな変量の対比による数値化方法について学びデータ解析で実践する。島津 秀康
力丸 佑紀
4/28②
5線形モデル3QR分解、二乗ノルムの分解、次元の概念を学び、モデルでの変量の寄与を評価する。島津 秀康
力丸 佑紀
5/12②
6線形と非線形とは平滑化について学び、データから非線形なトレンドの抽出とモデルの探索を実践する。島津 秀康
力丸 佑紀
5/19②
7データに潜むトレンドとモデルの探索増殖(成長)過程の微分方程式を通して、データに見られる線形、非線形パターン生成メカニズムの違いを学ぶ。非線形最小二乗法を学び、データ解析での実践を通して理解を深める。島津 秀康
力丸 佑紀
5/26②
8非線形モデル1モデル残差の検証とモデルに仮定した誤差の構造について理解を深める。最尤法を通じ、確率過程から導かれる確率分布にもとづいた増殖(成長)モデルの表現をデータ解析で実践する。島津 秀康
力丸 佑紀
6/2②
9非線形モデル2最尤法を通じ、確率過程から導かれる確率分布にもとづいた増殖(成長)モデルの表現をデータ解析で実践する。
種々のモデル残差の検証を通してモデルの改良のアプローチを議論する。
島津 秀康
力丸 佑紀
6/9②
10非線形モデル3差分(微分)構造に対する確率モデルの評価をデータ解析で実践する。島津 秀康
力丸 佑紀
6/16②
11確定的と確率的モデルとは指数分布族に代表される種々の確率分布が確率モデルで果たす役割を理解する。島津 秀康
力丸 佑紀
6/23②
12確率モデル1最尤法を通じ、これまでのモデリングの拡張として指数分布族に代表される種々の確率分布モデルの表現をデータ解析で実践する。島津 秀康
力丸 佑紀
6/30②
13確率モデル2確率モデルの階層構造を学び、さらに自由度の高いモデリングアプローチを実践する。島津 秀康
力丸 佑紀
7/7②
14確率モデル3確率的モデルを評価する尤離度と残差の概念を学び、モデルの評価をデータ解析で実践する。島津 秀康
力丸 佑紀
7/14②
15まとめ学んだモデル化の考え方を総括し、モデリングの過程でのデータ解析者の視点の変化について議論する。島津 秀康
力丸 佑紀
7/28②
No. 1
項目
データ行列
内容
データの取得と記述、変量と記録、データテーブルと型、データクリーニング、データ行列の線形演算(平均、分散、中心化など)。
担当者
島津 秀康
力丸 佑紀
日時
4/7②
No. 2
項目
データの探索
内容
データの雲の中でデータ間の距離の概念(ノルム)、
座標軸の張替えの概念(特異値分解)について学び、均質性を探るアプローチを実践する。
担当者
島津 秀康
力丸 佑紀
日時
4/14②
No. 3
項目
線形モデル1
内容
直交射影による最小二乗法の実現をデータ解析での実践を通して学び、モデルが説明し残した残差の検証方法について、視覚的にモデルの妥当性を検討する。
担当者
島津 秀康
力丸 佑紀
日時
4/21②
No. 4
項目
線形モデル2
内容
カテゴリカルな変量の対比による数値化方法について学びデータ解析で実践する。
担当者
島津 秀康
力丸 佑紀
日時
4/28②
No. 5
項目
線形モデル3
内容
QR分解、二乗ノルムの分解、次元の概念を学び、モデルでの変量の寄与を評価する。
担当者
島津 秀康
力丸 佑紀
日時
5/12②
No. 6
項目
線形と非線形とは
内容
平滑化について学び、データから非線形なトレンドの抽出とモデルの探索を実践する。
担当者
島津 秀康
力丸 佑紀
日時
5/19②
No. 7
項目
データに潜むトレンドとモデルの探索
内容
増殖(成長)過程の微分方程式を通して、データに見られる線形、非線形パターン生成メカニズムの違いを学ぶ。非線形最小二乗法を学び、データ解析での実践を通して理解を深める。
担当者
島津 秀康
力丸 佑紀
日時
5/26②
No. 8
項目
非線形モデル1
内容
モデル残差の検証とモデルに仮定した誤差の構造について理解を深める。最尤法を通じ、確率過程から導かれる確率分布にもとづいた増殖(成長)モデルの表現をデータ解析で実践する。
担当者
島津 秀康
力丸 佑紀
日時
6/2②
No. 9
項目
非線形モデル2
内容
最尤法を通じ、確率過程から導かれる確率分布にもとづいた増殖(成長)モデルの表現をデータ解析で実践する。
種々のモデル残差の検証を通してモデルの改良のアプローチを議論する。
担当者
島津 秀康
力丸 佑紀
日時
6/9②
No. 10
項目
非線形モデル3
内容
差分(微分)構造に対する確率モデルの評価をデータ解析で実践する。
担当者
島津 秀康
力丸 佑紀
日時
6/16②
No. 11
項目
確定的と確率的モデルとは
内容
指数分布族に代表される種々の確率分布が確率モデルで果たす役割を理解する。
担当者
島津 秀康
力丸 佑紀
日時
6/23②
No. 12
項目
確率モデル1
内容
最尤法を通じ、これまでのモデリングの拡張として指数分布族に代表される種々の確率分布モデルの表現をデータ解析で実践する。
担当者
島津 秀康
力丸 佑紀
日時
6/30②
No. 13
項目
確率モデル2
内容
確率モデルの階層構造を学び、さらに自由度の高いモデリングアプローチを実践する。
担当者
島津 秀康
力丸 佑紀
日時
7/7②
No. 14
項目
確率モデル3
内容
確率的モデルを評価する尤離度と残差の概念を学び、モデルの評価をデータ解析で実践する。
担当者
島津 秀康
力丸 佑紀
日時
7/14②
No. 15
項目
まとめ
内容
学んだモデル化の考え方を総括し、モデリングの過程でのデータ解析者の視点の変化について議論する。
担当者
島津 秀康
力丸 佑紀
日時
7/28②

到達目標

理論背景を理解したうえで、実データの解析演習を通してモデル探索と構築、その適切性の評価や解釈ができるようになる。

評価方法

講義内での課題(40%)とレポート(60%)の結果から総合的に判断する。

準備学習(予習・復習等)

【講義時間外に必要な学習の時間:60 時間】
予習:事前に指定する講義資料を読み、疑問点を明確にしておくこと。
復習:時間内に終了しなかった演習問題に取組む。

備考・その他

講義に関する時間外での質問はイントラネット上で対応し、受講者全員で共有する。
【関連科目:生物多様性モデリング、時系列・空間データモデリング、最適化】

教材

種別書名著者・編者発行所
教科書配布資料あり
参考書データ分析とデータサイエンス柴田里程近代科学社
参考書データサイエンスの作法柴田里程近代科学社
参考書Generalized Additive ModelsSimon WoodChapman & Hall
参考書Core StatisticsSimon WoodCambridge University Press
参考書Introduction to Statistical Modelling and InferenceMurray AitkinCRC Press
教科書
署名
配布資料あり
著者・編者
発行所
参考書
署名
データ分析とデータサイエンス
著者・編者
柴田里程
発行所
近代科学社
参考書
署名
データサイエンスの作法
著者・編者
柴田里程
発行所
近代科学社
参考書
署名
Generalized Additive Models
著者・編者
Simon Wood
発行所
Chapman & Hall
参考書
署名
Core Statistics
著者・編者
Simon Wood
発行所
Cambridge University Press
参考書
署名
Introduction to Statistical Modelling and Inference
著者・編者
Murray Aitkin
発行所
CRC Press