Web Syllabus(講義概要)
トップへ戻る 前のページへ戻る
データ解析とその数理Ⅰ
英文名Data Analysis and Mathematical Principles I
科目概要データサイエンス学科2年前期、3群科目、必修、演習、3単位
科目責任者 島津 秀康
担当者(※は実務経験のある教員) 島津 秀康※力丸 佑紀※ウ・ニクハン
講義室

教員免許取得のための必修科目

科目教科及び教科の指導法に関する科目(高等学校 情報)
各科目に含めることが必要な事項
  • 教科に関する専門的事項コンピュータ及び情報処理(実習を含む。)

授業の目的

線形空間、射影や次元といった線形代数での重要な概念が、様々なデータ解析アプローチの基礎となることを学ぶ。理論背景を理解したうえで、実データの解析演習を通してモデル探索と構築、その適切性の評価や解釈ができるようになることを目的とする。

教育内容

データの取得と記述、データ雲の探索、変量間の関係のモデル化について学ぶ。

教育方法

データ解析の数理的背景を講義しながら、実データ解析の演習を通して実践的理解を深める。活発なクループ演習活動を通してプレゼンテーション技術向上も目指す。演習にはデータ解析言語Rを用いる。
講義中の課題についての重要なコメントは受講者全員で共有する。

卒業・学位授与の方針と当該科目の関連

DP4、DP5

授業内容(シラバス)

項目内容担当者日時
1・2
データとはデータの取得と記述、変量と記録、データテーブルと型、データクリーニングについて学ぶ。島津 秀康
力丸 佑紀
ウ・ニクハン
4/8③④
3・4
データ行列行と列の扱いの違い、データ行列の線形演算(平均、分散、中心化など)について理解を深める。島津 秀康
力丸 佑紀
ウ・ニクハン
4/15③④
5・6
データの探索1データの雲の中でデータ間の距離の概念(ノルム)について学び、データの均質性を探るアプローチを実践する。島津 秀康
力丸 佑紀
ウ・ニクハン
4/22③④
7・8
データの探索2データの雲の中で座標軸の張り替えの概念(特異値分解)について学び、均質性を探るアプローチを実践する。島津 秀康
力丸 佑紀
ウ・ニクハン
5/13③④
9・10回変量間関係のモデル1直交射影による最小二乗法の実現をデータ解析での実践を通して学ぶ。島津 秀康
力丸 佑紀
ウ・ニクハン
5/20③④
11・12回変量間関係のモデル2モデルが説明し残した残差の検証方法について、視覚的にモデルの妥当性を検討する。島津 秀康
力丸 佑紀
ウ・ニクハン
5/27③④
13・14回変量間関係のモデル3カテゴリカルな変量の対比による数値化方法について学びデータ解析で実践する。島津 秀康
力丸 佑紀
ウ・ニクハン
6/3③④
15・16回変量間関係のモデル4QR分解、二乗ノルムの分解、次元の概念を学び、モデルでの変量の寄与を評価する。島津 秀康
力丸 佑紀
ウ・ニクハン
6/10③④
17・18回グループ課題演習1グループ演習を通してデータの取得、データのクリーニングに取り組む。島津 秀康
力丸 佑紀
ウ・ニクハン
6/17③④
19・20回グループ課題演習2グループ演習を通してデータの探索的解析に取り組む。島津 秀康
力丸 佑紀
ウ・ニクハン
6/24③④
21・22回グループ課題演習3グループ演習を通してモデルの構築と改良に取り組み、結果をまとめる。島津 秀康
力丸 佑紀
ウ・ニクハン
7/1③④
23・24回まとめ全体の確認と復習。島津 秀康
力丸 佑紀
ウ・ニクハン
7/8③④
1・2
項目
データとは
内容
データの取得と記述、変量と記録、データテーブルと型、データクリーニングについて学ぶ。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
4/8③④
3・4
項目
データ行列
内容
行と列の扱いの違い、データ行列の線形演算(平均、分散、中心化など)について理解を深める。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
4/15③④
5・6
項目
データの探索1
内容
データの雲の中でデータ間の距離の概念(ノルム)について学び、データの均質性を探るアプローチを実践する。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
4/22③④
7・8
項目
データの探索2
内容
データの雲の中で座標軸の張り替えの概念(特異値分解)について学び、均質性を探るアプローチを実践する。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
5/13③④
9・10回
項目
変量間関係のモデル1
内容
直交射影による最小二乗法の実現をデータ解析での実践を通して学ぶ。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
5/20③④
11・12回
項目
変量間関係のモデル2
内容
モデルが説明し残した残差の検証方法について、視覚的にモデルの妥当性を検討する。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
5/27③④
13・14回
項目
変量間関係のモデル3
内容
カテゴリカルな変量の対比による数値化方法について学びデータ解析で実践する。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
6/3③④
15・16回
項目
変量間関係のモデル4
内容
QR分解、二乗ノルムの分解、次元の概念を学び、モデルでの変量の寄与を評価する。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
6/10③④
17・18回
項目
グループ課題演習1
内容
グループ演習を通してデータの取得、データのクリーニングに取り組む。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
6/17③④
19・20回
項目
グループ課題演習2
内容
グループ演習を通してデータの探索的解析に取り組む。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
6/24③④
21・22回
項目
グループ課題演習3
内容
グループ演習を通してモデルの構築と改良に取り組み、結果をまとめる。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
7/1③④
23・24回
項目
まとめ
内容
全体の確認と復習。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
7/8③④

到達目標

理論背景を理解したうえで、実データの解析演習を通してモデル探索と構築、その適切性の評価や解釈ができるようになることを目標とする。

評価方法

講義内での課題(60%)とレポート(40%)の結果から総合的に評価する。

準備学習(予習・復習等)

【講義時間外に必要な学修時間:87時間】
予習:次回扱う行列の基礎(線形代数)に関連する範囲について、1年次の内容を復習しておくこと。
復習:時間内に終了しなかった演習問題に取り組みながら、講義中に議論した理論的事項について実践と理解を一致させる。

備考・その他

講義に関する時間外での質問はイントラネット上で対応し、受講者全員で共有する。
【科目ナンバリング:FU302-DM02】
【関連科目:ベクトルと行列、線形代数、線形代数演習、データハンドリングと可視化】

実務経験の授業への活用方法

(島津)政府研究所でのデータ解析とモデリング研究経験をもとに解説を行う。
(力丸)研究所でのデータ解析経験をもとに、データの取得と適切な記述について解説を行う。

教材

種別書名著者・編者発行所
教科書(なし)
参考書データ分析とデータサイエンス柴田里程近代科学社
参考書データサイエンスの作法柴田里程近代科学社
教科書
署名
著者・編者
発行所
参考書
署名
データ分析とデータサイエンス
著者・編者
柴田里程
発行所
近代科学社
参考書
署名
データサイエンスの作法
著者・編者
柴田里程
発行所
近代科学社