
| 英文名 | Data Analysis and Mathematical Principles I | |
|---|---|---|
| 科目概要 | データサイエンス学科2年前期、3群科目、必修、演習、3単位 |
|
| 科目責任者 | 島津 秀康 | |
| 担当者 | (※は実務経験のある教員) 島津 秀康※、 |
|
| 講義室 | ||
| 科目 | 教科及び教科の指導法に関する科目(高等学校 情報) |
|---|---|
| 各科目に含めることが必要な事項 |
|
線形空間、射影や次元といった線形代数での重要な概念が、様々なデータ解析アプローチの基礎となることを学ぶ。理論背景を理解したうえで、実データの解析演習を通してモデル探索と構築、その適切性の評価や解釈ができるようになることを目的とする。
データの取得と記述、データ雲の探索、変量間の関係のモデル化について学ぶ。
データ解析の数理的背景を講義しながら、実データ解析の演習を通して実践的理解を深める。活発なクループ演習活動を通してプレゼンテーション技術向上も目指す。演習にはデータ解析言語Rを用いる。
講義中の課題についての重要なコメントは受講者全員で共有する。
DP4、DP5
| 回 | 項目 | 内容 | 担当者 | 日時 |
|---|---|---|---|---|
| 1・2 回 |
データとは | データの取得と記述、変量と記録、データテーブルと型、データクリーニングについて学ぶ。 | 島津 秀康 力丸 佑紀 ウ・ニクハン |
4/7③④ |
| 3・4 回 |
データ行列 | 行と列の扱いの違い、データ行列の線形演算(平均、分散、中心化など)について理解を深める。 | 島津 秀康 力丸 佑紀 ウ・ニクハン |
4/14③④ |
| 5・6 回 |
データの探索1 | データの雲の中でデータ間の距離の概念(ノルム)について学び、データの均質性を探るアプローチを実践する。 | 島津 秀康 力丸 佑紀 ウ・ニクハン |
4/21③④ |
| 7・8 回 |
データの探索2 | データの雲の中で座標軸の張り替えの概念(特異値分解)について学び、均質性を探るアプローチを実践する。 | 島津 秀康 力丸 佑紀 ウ・ニクハン |
4/28③④ |
| 9・10回 | 変量間関係のモデル1 | 直交射影による最小二乗法の実現をデータ解析での実践を通して学ぶ。 | 島津 秀康 力丸 佑紀 ウ・ニクハン |
5/12③④ |
| 11・12回 | 変量間関係のモデル2 | モデルが説明し残した残差の検証方法について、視覚的にモデルの妥当性を検討する。 | 島津 秀康 力丸 佑紀 ウ・ニクハン |
5/19③④ |
| 13・14回 | 変量間関係のモデル3 | カテゴリカルな変量の対比による数値化方法について学びデータ解析で実践する。 | 島津 秀康 力丸 佑紀 ウ・ニクハン |
5/26③④ |
| 15・16回 | 変量間関係のモデル4 | QR分解、二乗ノルムの分解、次元の概念を学び、モデルでの変量の寄与を評価する。 | 島津 秀康 力丸 佑紀 ウ・ニクハン |
6/2③④ |
| 17・18回 | グループ課題演習1 | グループ演習を通してデータの取得、データのクリーニングに取り組む。 | 島津 秀康 力丸 佑紀 ウ・ニクハン |
6/9③④ |
| 19・20回 | グループ課題演習2 | グループ演習を通してデータの探索的解析に取り組む。 | 島津 秀康 力丸 佑紀 ウ・ニクハン |
6/16③④ |
| 21・22回 | グループ課題演習3 | グループ演習を通してモデルの構築と改良に取り組み、結果をまとめる。 | 島津 秀康 力丸 佑紀 ウ・ニクハン |
6/23③④ |
| 23・24回 | まとめ | 全体の確認と復習。 | 島津 秀康 力丸 佑紀 ウ・ニクハン |
6/30③④ |
理論背景を理解したうえで、実データの解析演習を通してモデル探索と構築、その適切性の評価や解釈ができるようになることを目標とする。
講義内での課題(60%)とレポート(40%)の結果から総合的に評価する。
【講義時間外に必要な学修時間:87時間】
予習:次回扱う行列の基礎(線形代数)に関連する範囲について、1年次の内容を復習しておくこと。
復習:時間内に終了しなかった演習問題に取り組みながら、講義中に議論した理論的事項について実践と理解を一致させる。
講義に関する時間外での質問はイントラネット上で対応し、受講者全員で共有する。
【科目ナンバリング:FU302-DM02】
【関連科目:ベクトルと行列、線形代数、線形代数演習、データハンドリングと可視化】
(島津)政府研究所でのデータ解析とモデリング研究経験をもとに解説を行う。
(力丸)研究所でのデータ解析経験をもとに、データの取得と適切な記述について解説を行う。
(ウ)国立研究所でのリスク因子に関するモデリング研究経験をもとに解説を行う。
| 種別 | 書名 | 著者・編者 | 発行所 |
|---|---|---|---|
| 教科書 | (なし) | ||
| 参考書 | データ分析とデータサイエンス | 柴田里程 | 近代科学社 |
| 参考書 | データサイエンスの作法 | 柴田里程 | 近代科学社 |