Web Syllabus(講義概要)
トップへ戻る 前のページへ戻る
データ解析とその数理Ⅰ
英文名 Data Analysis and Mathematical Principles I
科目概要 データサイエンス学科2年前期、3群科目、必修、演習、3単位
科目責任者  島津 秀康
担当者 (※は実務経験のある教員) 島津 秀康※力丸 佑紀※ウ・ニクハン
講義室

教員免許取得のための必修科目

科目 教科及び教科の指導法に関する科目(高等学校 情報)
各科目に含めることが必要な事項
  • 教科に関する専門的事項 コンピュータ・情報処理

授業の目的

線形空間、射影や次元といった線形代数での重要な概念が、様々なデータ解析アプローチの基礎となることを学ぶ。理論背景を理解したうえで、実データの解析演習を通してモデル探索と構築、その適切性の評価や解釈ができるようになることを目的とする。

教育内容

データの取得と記述、データ雲の探索、変量間の関係のモデル化について学ぶ。

教育方法

データ解析の数理的背景を講義しながら、実データ解析の演習を通して実践的理解を深める。活発なクループ演習活動を通してプレゼンテーション技術向上も目指す。演習にはデータ解析言語Rを用いる。
講義中の課題についての重要なコメントは受講者全員で共有する。

卒業・学位授与の方針と当該科目の関連

DP4、DP5

授業内容(シラバス)

項目 内容 担当者 日時
1・2
データとは データの取得と記述、変量と記録、データテーブルと型、データクリーニングについて学ぶ。 島津 秀康
力丸 佑紀
ウ・ニクハン
4/7③④
3・4
データ行列 行と列の扱いの違い、データ行列の線形演算(平均、分散、中心化など)について理解を深める。 島津 秀康
力丸 佑紀
ウ・ニクハン
4/14③④
5・6
データの探索1 データの雲の中でデータ間の距離の概念(ノルム)について学び、データの均質性を探るアプローチを実践する。 島津 秀康
力丸 佑紀
ウ・ニクハン
4/21③④
7・8
データの探索2 データの雲の中で座標軸の張り替えの概念(特異値分解)について学び、均質性を探るアプローチを実践する。 島津 秀康
力丸 佑紀
ウ・ニクハン
4/28③④
9・10回 変量間関係のモデル1 直交射影による最小二乗法の実現をデータ解析での実践を通して学ぶ。 島津 秀康
力丸 佑紀
ウ・ニクハン
5/12③④
11・12回 変量間関係のモデル2 モデルが説明し残した残差の検証方法について、視覚的にモデルの妥当性を検討する。 島津 秀康
力丸 佑紀
ウ・ニクハン
5/19③④
13・14回 変量間関係のモデル3 カテゴリカルな変量の対比による数値化方法について学びデータ解析で実践する。 島津 秀康
力丸 佑紀
ウ・ニクハン
5/26③④
15・16回 変量間関係のモデル4 QR分解、二乗ノルムの分解、次元の概念を学び、モデルでの変量の寄与を評価する。 島津 秀康
力丸 佑紀
ウ・ニクハン
6/2③④
17・18回 グループ課題演習1 グループ演習を通してデータの取得、データのクリーニングに取り組む。 島津 秀康
力丸 佑紀
ウ・ニクハン
6/9③④
19・20回 グループ課題演習2 グループ演習を通してデータの探索的解析に取り組む。 島津 秀康
力丸 佑紀
ウ・ニクハン
6/16③④
21・22回 グループ課題演習3 グループ演習を通してモデルの構築と改良に取り組み、結果をまとめる。 島津 秀康
力丸 佑紀
ウ・ニクハン
6/23③④
23・24回 まとめ 全体の確認と復習。 島津 秀康
力丸 佑紀
ウ・ニクハン
6/30③④
1・2
項目
データとは
内容
データの取得と記述、変量と記録、データテーブルと型、データクリーニングについて学ぶ。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
4/7③④
3・4
項目
データ行列
内容
行と列の扱いの違い、データ行列の線形演算(平均、分散、中心化など)について理解を深める。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
4/14③④
5・6
項目
データの探索1
内容
データの雲の中でデータ間の距離の概念(ノルム)について学び、データの均質性を探るアプローチを実践する。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
4/21③④
7・8
項目
データの探索2
内容
データの雲の中で座標軸の張り替えの概念(特異値分解)について学び、均質性を探るアプローチを実践する。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
4/28③④
9・10回
項目
変量間関係のモデル1
内容
直交射影による最小二乗法の実現をデータ解析での実践を通して学ぶ。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
5/12③④
11・12回
項目
変量間関係のモデル2
内容
モデルが説明し残した残差の検証方法について、視覚的にモデルの妥当性を検討する。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
5/19③④
13・14回
項目
変量間関係のモデル3
内容
カテゴリカルな変量の対比による数値化方法について学びデータ解析で実践する。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
5/26③④
15・16回
項目
変量間関係のモデル4
内容
QR分解、二乗ノルムの分解、次元の概念を学び、モデルでの変量の寄与を評価する。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
6/2③④
17・18回
項目
グループ課題演習1
内容
グループ演習を通してデータの取得、データのクリーニングに取り組む。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
6/9③④
19・20回
項目
グループ課題演習2
内容
グループ演習を通してデータの探索的解析に取り組む。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
6/16③④
21・22回
項目
グループ課題演習3
内容
グループ演習を通してモデルの構築と改良に取り組み、結果をまとめる。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
6/23③④
23・24回
項目
まとめ
内容
全体の確認と復習。
担当者
島津 秀康
力丸 佑紀
ウ・ニクハン
日時
6/30③④

到達目標

理論背景を理解したうえで、実データの解析演習を通してモデル探索と構築、その適切性の評価や解釈ができるようになることを目標とする。

評価方法

講義内での課題(60%)とレポート(40%)の結果から総合的に評価する。

準備学習(予習・復習等)

【講義時間外に必要な学修時間:87時間】
予習:次回扱う行列の基礎(線形代数)に関連する範囲について、1年次の内容を復習しておくこと。
復習:時間内に終了しなかった演習問題に取り組みながら、講義中に議論した理論的事項について実践と理解を一致させる。

備考・その他

講義に関する時間外での質問はイントラネット上で対応し、受講者全員で共有する。
【科目ナンバリング:FU302-DM02】
【関連科目:ベクトルと行列、線形代数、線形代数演習、データハンドリングと可視化】

実務経験の授業への活用方法

(島津)政府研究所でのデータ解析とモデリング研究経験をもとに解説を行う。
(力丸)研究所でのデータ解析経験をもとに、データの取得と適切な記述について解説を行う。
(ウ)国立研究所でのリスク因子に関するモデリング研究経験をもとに解説を行う。

教材

種別 書名 著者・編者 発行所
教科書 (なし)
参考書 データ分析とデータサイエンス 柴田里程 近代科学社
参考書 データサイエンスの作法 柴田里程 近代科学社
教科書
書名
著者・編者
発行所
参考書
書名
データ分析とデータサイエンス
著者・編者
柴田里程
発行所
近代科学社
参考書
書名
データサイエンスの作法
著者・編者
柴田里程
発行所
近代科学社