英文名 | Data handling and visualization | |
---|---|---|
科目概要 | データサイエンス学科2年後期、3群科目、必修、演習、2単位 | |
科目責任者 | 鎌田 真由美 | |
担当者 | (※は実務経験のある教員) 鎌田 真由美、 牧垣 秀一朗※、 ジャヤクマル・ワサンタン※ | |
講義室 |
科目 | 教科及び教科の指導法に関する科目(高等学校 情報) |
---|---|
各科目に含めることが必要な事項 |
|
データサイエンスの解析の大半を占めるデータ前処理を適切に行うため、データを適した形に加工するための技術と、データを正しく理解するための可視化技術について学ぶ。
データサイエンスにおける解析の約8割は、データの事前準備、つまり前処理と言われている。データハンドリングは、データの特性に基づき適した形に加工し、有効な変数を設計できるようにする手法である。また、データの特性を正しく知る上では「情報の可視化」が重要となる。可視化は、結果の確認や説明だけで無く、データサイエンスのあらゆるプロセスで必要となる要素である。本講義では、データハンドリングとしてデータベースとデータベースを扱うためのSQLの基礎、そして可視化についてその歴史とプログラミング手法を演習で身につける。また、外部講師を招いてデータ可視化の最新事例についても学ぶ。
毎回項目に関する資料を配布し、その内容について理解を深めるためにパワーポイントおよびPythonスクリプトを用いて講義形式で進める。また、手技を身につけるため、項目に応じて数回程度の演習を行う。
演習課題に関する模範解答の配布およびフィードバックを行う。
DP4、DP5
回 | 項目 | 内容 | 担当者 | 日時 |
---|---|---|---|---|
1 | データサイエンスプロセスとデータハンドリング | データサイエンスにおけるデータハンドリングと可視化の意義、目的について理解する。 | 鎌田 真由美 | 9/10④ |
2 | データベースの基礎 | データベースの目的と意義、RDBの基礎とデータ型について理解する。 | 鎌田 真由美 | 9/17④ |
3 | SQLの基礎 | SQLの基本と演算子、関数について、演習を通して理解する。 | 鎌田 真由美 ジャヤクマル・ワサンタン | 9/24④ |
4 | SQLによるデータ処理1 | SQLを用いたデータ抽出・集計の基本操作について、演習を通して理解する。 | 鎌田 真由美 ジャヤクマル・ワサンタン | 10/1④ |
5 | SQLによるデータ処理2 | SQLを用いた結合などの基本操作について、演習を通して理解する。 | 鎌田 真由美 ジャヤクマル・ワサンタン | 10/8④ |
6 | 分析データの加工1 | 分析目的の定義、欠損値や外れ値、質的変数の処理について理解する。 | 鎌田 真由美 | 10/15④ |
7 | 分析データの加工2 | スケーリングや次元削減の処理について理解する。 | 鎌田 真由美 | 10/22④ |
8 | データ加工の実践 | 実データを用いたデータ加工の演習を行い、手技を習得する。 | 鎌田 真由美 牧垣 秀一朗 | 10/29④ |
9 | データ可視化の基礎1 | 可視化の歴史、データ可視化の定義と用途による類型を理解する。 | 鎌田 真由美 | 11/12④ |
10 | データ可視化の基礎2 | 各種可視化表現と適正について理解する。 | 鎌田 真由美 | 11/19④ |
11 | データ可視化手法1 | 可視化ライブラリについて理解し、演習を通して使い方を習得する。 | 鎌田 真由美 牧垣 秀一朗 | 11/26④ |
12 | データ可視化手法2 | 学んだ手法を用いて実データの可視化についての演習で使い方を習得する。 | 鎌田 真由美 牧垣 秀一朗 | 12/3④ |
13 | データ可視化の実践1 | 課題データ加工を、これまでに習得したデータ処理手法と可視化手法を用いて実践する。 | 鎌田 真由美 牧垣 秀一朗 ジャヤクマル・ワサンタン | 12/10④ |
14 | データ可視化の実践2 | 加工データに対する解析結果の可視化表現について検討し、演習を通して実践する。 | 鎌田 真由美 牧垣 秀一朗 ジャヤクマル・ワサンタン | 12/17④ |
15 | 応用事例 | ゲストスピーカーを招き、実践的な可視化手法について学ぶ。 | 鎌田 真由美 | 12/24④ |
データ特性に合わせた処理方法と可視化表現を適切に選択し、表現することができるようになる。
初回を除く毎回の理解度確認課題(40%)とレポート演習課題(60%)で総合的に評価する。
【講義時間外に必要な学修時間:60時間】
予習:事前に指定する次回講義に関するキーワードについて調べ、疑問点を明らかにしておくこと。
復習:講義中に出題する課題について解答を作成し、次回講義での解説に基づき比較・検討する
講義に関する質問はメールや対面で個別に対応すると共に、重要な質問に関しては受講者全員で共有する。
【科目ナンバリング:FU302-DM02】
【関連科目:プログラミングⅠ】
(牧垣)複数民間企業でのデータ分析・基盤開発・活用経験をもとに、データ分析や可視化に関する講義を行う。
(ジャヤクマル)企業でのデータ分析経験を踏まえ、大規模データの扱い方や可視化について紹介・解説する。
種別 | 書名 | 著者・編者 | 発行所 |
---|---|---|---|
教科書 | 配布資料あり | ||
参考書 | 分析者のためのデータ解釈学入門 データの本質をとらえる技術 | 江崎貴裕 | ソシム |
参考書 | 図解まるわかり データベースのしくみ | 坂上 幸大 | 翔泳社 |
参考書 | データ分析者のためのPythonデータビジュアライゼーション入門 コードと連動してわかる可視化手法 | 小久保 奈都弥 | 翔泳社 |