英文名 | Biological Sequence Analysis | |
---|---|---|
科目概要 | 未来工学研究科(修士課程)生命データサイエンス専攻修士1年後期、専門科目、選択、講義、2単位 | |
科目責任者 | 齋藤 裕 | |
担当者 | (※は実務経験のある教員) 齋藤 裕 | |
講義室 |
生体分子であるタンパク質・RNA・DNAはいずれも文字列として表現できるため、その解析には文字列データのためのアルゴリズムや、言語を扱うための確率モデルが有用である。本講義では、生物配列解析のためのアルゴリズムや確率モデルについて学ぶ。
配列を比較(アラインメント)するための各種アルゴリズム、生物配列から機能や高次構造を推定するための隠れマルコフモデルや確率文脈自由文法などの確率モデルについて学ぶ。大規模なデータベースから配列を検索する問題(相同性検索)、高速シーケンサーから出力される大量の配列をゲノムにアラインメントする問題(リードマッピング)について、計算を効率化するための技法について学ぶ。
パワーポイントによる講義形式ですすめる。パワーポイント資料は講義前にホームページ等で配布する。毎回の講義では、理解度確認のために基礎的な内容の課題を出題する。また、数回の講義ごとに、応用的な内容のレポート課題を出題する。
講義内課題、レポート課題については、提出後に模範解答を配布して解説を行う。
DP1、DP2
回 | 項目 | 内容 | 担当者 | 日時 |
---|---|---|---|---|
1 | イントロダクション | 生物配列解析の様々な問題について俯瞰する。本科目で必要となる確率の基礎知識について復習する。 | 齋藤 裕 | 9/10② |
2 | ペアワイズアラインメント | 2つの配列を比較するペアワイズアラインメントのアルゴリズムについて学ぶ。 | 齋藤 裕 | 9/17② |
3 | マルチプルアラインメント | 3つ以上の配列を比較するマルチプルアラインメントのアルゴリズムについて学ぶ。 | 齋藤 裕 | 9/24② |
4 | 隠れマルコフモデル(HMM) | 配列から様々な推論を行うための確率モデルである隠れマルコフモデル(HMM)について学ぶ。 | 齋藤 裕 | 10/1② |
5 | ペアHMM | HMMにもとづくペアワイズアラインメント手法であるペアHMMについて学ぶ。 | 齋藤 裕 | 10/8② |
6 | プロファイルHMM | HMMを用いて配列群と単一配列のアラインメントを行う手法であるプロファイルHMMについて学ぶ。 | 齋藤 裕 | 10/15② |
7 | 確率文脈自由文法(SCFG) | 確率文法の基礎を学び、HMMが確率文法の1種であることを学ぶ。また、HMMよりも複雑な文法を表現できる確率文脈自由文法(SCFG)について学ぶ。 | 齋藤 裕 | 10/22② |
8 | RNA構造解析1 | RNAの2次構造予測がSCFGで表現できることを学ぶ。また、2次構造予測のためのアルゴリズムについて学ぶ。 | 齋藤 裕 | 10/29② |
9 | RNA構造解析2 | 2次構造を考慮しながらRNAの配列群と単一配列のアラインメントを行うアルゴリズムについて学ぶ。 | 齋藤 裕 | 11/12② |
10 | 相同性検索 | 大規模なデータベースから配列を検索する手法について学ぶ。代表的な手法であるBLASTを例として、検索を高速化するための技法について学ぶ。 | 齋藤 裕 | 11/19② |
11 | アラインメントスコアの統計 | 相同性検索の結果の統計的有意性を評価する手法について学ぶ。 | 齋藤 裕 | 11/26② |
12 | リードマッピング1 | 高速シーケンサーから出力される大量の配列をゲノムにアラインメントする手法について学ぶ。 | 齋藤 裕 | 12/3② |
13 | リードマッピング2 | 代表的なリードマッピング手法であるBowtieやBWAにおいて、計算の高速化のために用いられる技法について学ぶ。 | 齋藤 裕 | 12/10② |
14 | 生物配列解析と機械学習 | これまで学んできた生物配列解析の手法と機械学習の融合について学ぶ。 | 齋藤 裕 | 12/17② |
15 | まとめ | 全体の確認と復習を行う。 | 齋藤 裕 | 12/24② |
生物配列を解析するためのアルゴリズムや確率モデルについて理解できる。
講義内で出題する課題(30%)、レポート課題(70%)の合計で評価する。
【講義時間外に必要な学習の時間:60 時間】
予習:事前に配布する講義資料を読み、疑問点を明確にしておくこと。
復習:レポート課題の解答を作成し、提出後に配布する模範解答との比較・考察を行うこと。
講義に関する質問はメールや対面にて受け付ける。
【関連科目:ゲノム科学特論、分子進化特論】
※本科目は確率の基礎知識を使用するため、不安がある場合には、学部科目の「確率の数理」や「尤度とモデリングの数理」の聴講を推奨する。
種別 | 書名 | 著者・編者 | 発行所 |
---|---|---|---|
教科書 | なし | ||
参考書 | Biological Sequence Analysis: Probabilistic Models of Proteins and Nucleic Acids | Richard Durbinら | Cambridge University Press |