はじめに
このページは、2022年10月に培風館より刊行された書籍「Web連携テキスト バイオインフォマティクス」のWeb連携に相当する部分です。本書は、その大部分が東京大学・大学院農学生命科学研究科に設置されているバイオインフォマティクスの教育プログラムである、アグリバイオインフォマティクス教育研究プログラムの講義内容と密接に関連しています。幅広い内容を取り扱うため、このページは用語説明が中心ですが、カラーの図、例題の解答、演習問題とその解答、コラム、プログラムや文献へのリンクなど豊富な情報を提供しています。本書はこのページの対応する箇所を眺めながら読み進めてもらうことを想定していますのでご注意ください。既出の情報をページ内検索などで探す手間を減らすべく、本文中の出現順に既出の図や数式を再掲するなどの工夫をしています(ただし同一段落内はその限りではありません)。
計7つの章全体として共通しているのは、用語説明、図、例題とその解答(準備中を含む)、文献へのリンクがあることです。現在見えているこれらが本書のWeb連携資料として提供している部分となります。逆にいえば、それ以外はプラスアルファ(おまけ)として提供しているものですので予めご承知おきください。たとえば、演習問題を提供しているのは第3章と第4章のみであり、他章での提供予定はありません。他のプラスアルファ情報としては、データ解析環境Rを用いた実践的なハンズオン資料の提供があげられます(このページの左側1番下の付録という項目のことです)。本書はRを利用した解析内容が多く含まれているため、Rの基礎的な部分でつまずかないようにするのが主目的です。本書をRのハンズオン講義目的で利用したい教員側にとっては、付録の順番で進めるとよいかもしれません。随時更新していますので、是非有効利用していただければ幸いです。
本書は、バイオインフォマティクス分野のステレオタイプなイメージであるオミックス解析を中心とした内容(第1,
2, 3,
5章)だけでなく、分子シミュレーション(第4章)や分子進化(第6章)、そしてフィールドインフォマティクス(第7章)までカバーしています。その一方で、深層学習(deep
learning)など流行りのトピックにはあまり踏み込まず、日本では比較的マイナーな粒子群最適化(PSO)というアルゴリズムを第2章で丁寧に解説するなど、日本のバイオインフォマティクス関連の教科書全体として、記載内容の和集合を広げるような位置づけになっているのも特徴といえます。もちろんアグリバイオインフォマティクス教育研究プログラムでは、深層学習を含む機械学習全般や、本書ではほとんど触れていない事柄(たとえばメタゲノム解析、トランスクリプトーム解析、Pythonプログラミングなど)についても幅広くカバーしています(門田ら,
日本乳酸菌学会誌, 2021)。
冒頭部分でも述べていますが、本書はこのページの対応する箇所を眺めながら読み進めてもらうことを想定しています。このページの具体的な利用法として、目的の章・節・項にたどりつくためには、左記の項目名をクリックしていけばよいです。また、たとえば第2章の63ページ目にジャンプしたい場合は、第2章のページに移動したのち”page063“でページ内検索していただければページ番号でも検索できますので目的に応じてご利用ください。このページの用語説明の主なリンク先はWikipedia
(”CC
BY-SA“)です。文献のリンク先は可能な限りPubMedにしています。このページはR
Markdownで作成しており、html変換前の元ファイルはindex.Rmdです。本教科書に関する間違いのご指摘、エラーへの遭遇、要望などは、アグリバイオインフォマティクス教育研究プログラムの問い合わせフォームよりお願いいたします。リンク先のカテゴリの項目では、「教科書について」をお選びください。2
working
days以内に返事がない場合や、エラーメッセージのスクショなども含めて問い合わせをされたい方は、筆頭編者の門田(koji.kadota@gmail.com)宛てに直接メールしていただいてもかまいません。
お知らせ
- 2024/06/27
付録ページ内の各Rスクリプトを、ボタン1つでクリップボードにコピーできる機能を追加しました。
- 2023/06/03
問い合わせフォームを追加しました。
- 2023/05/31
複数の機関より、教材としての使用のお問い合わせをいただいております。このWeb資料中のほぼ全ての情報は、一応google
driveにまとめており、一括ダウンロード可能な状態ではあります。しかし、校正時の修正反映漏れなどのチェックやバージョン管理をしきれていないため、URLは公開しておりません。もしそれでもよいということでしたら、pdfだけでなく編集可能な大元のdocxやpptxを含めて提供可能ですのでお気軽にお問い合わせください。
- 2023/05/30
付録のR1.010において、Bioconductorパッケージであるqrqcのインストールでコケる問題が生じています。これは、2023/05/30現在のRの最新版であるR
ver.
4.3.0にqrqcが対応していないことに起因します。同様の問題は、発現変動解析分野で有名なedgeRや、edgeRに依存する我々のTCCでも生じています。できるだけ早く、R
ver. 4.3.0でインストールできるBioconductorパッケージに変更したものにR1.010の内容を変更予定ですので、今しばらくお待ちください。2023/05/31にWindows版は修正が完了しました。
- メールで問い合わせいただいたものがスパム判定され、実際に送信されてから丸2日後に気づくという事例がありました。
現在スパム漏れ対策として、問い合わせ受付用のgoogle
formを作成しつつあります。もし事務局(info@iu.a.u-tokyo.ac.jp)あてにメール送ったけど返事がないという方がいらっしゃいましたら、筆頭編者の門田(koji.kadota@gmail.com)宛てに催促いただけますようお願いいたしますm(_
_)m
変更履歴
- 2024/09/30 第2章のCptplotのリンク先を修正しました。
- 2024/07/28 付録ページ内の「R1.020
RStudioの基本的な利用法」のWindows版において、スライド37の計算中断手段をEscキーのみに変更しました(Ctrl
+
Cでは中断できない事例があることが判明したため)。(受講生提供情報)
- 2024/06/23
付録ページ内の各Rスクリプトをボタン1つでクリップボードにコピーできる機能を追加しました。
klippyというパッケージを利用しました。(利根
悠介氏 提供情報)
- 2023/09/14
付録ページの作成部分でミスっていたのを修正しました(作業ディレクトリの変更をせずに実行した結果を掲載していたようなイメージです)。
- 2023/09/12
第2章の用語解説の「感度」、「特異度」、そして「混同行列」の説明部分の文章を以下のように修正しました(計5箇所)。理由は、このようにしないとそれ以降の説明に矛盾が生じることに気づいたためです。
- 変更前:そのうちの一続きの600塩基の領域が真のCpGアイランド(CpG
island; CGI)だったとします。
- 変更後:そのうちの一続きの754塩基の領域が真のCpGアイランド(CpG
island; CGI)だったとします。
- 2023/09/04
第3章のpage087の位置が少しずれていたので修正しました。
- 2023/06/14
付録のR1.010において、インストール手順書のMac版を更新しました。主な変更点は2023/05/31に更新したのWindows版と同じです。
- 2023/06/04
はじめにの最後の段落の文章を変更しました。
- 2023/05/31
- 第3章の例題3.3において、入力として用いるアミノ酸配列であるNP_850469.1とBOR1_ARATHの入手に関する説明を追加しました。
- 第7章の例題7.2の6~7ページ目に、補足情報を追加しました。
- 付録のR1.010において、インストール手順書のWindows版を更新しました。主な変更点は、①R本体のバージョンを最新のR
ver. 4.3.0に変更、②R ver. 4.3.0を利用した場合に(R ver.
4.2.2の作成当時はうまくいっていた)Bioconductorのqrqcパッケージのインストールでコケる問題が生じていたので、Biostringsに変更、そして③利用するブラウザによってファイルダウンロード時の拡張子が変わってしまう問題の注意喚起を追加したという3点です。
- 2023/05/26
3.7.1項(page098)の真ん中付近にある、(1)~(5)の項目部分が変になっていたのを修正しました(Web資料のみ)。
- 2023/05/24
これまで1つの巨大なページとして構成していましたが、読み込みに非常に時間がかかっていたため、章ごとのページに変更しました。これらのページもR
Markdownで作成していますので、html変換前の大元のRmdファイルを以下に示しておきます:
- 2023/03/31
付録ページのR1.010とR1.020を大幅に更新しました。
- 2022/12月頃
第3章の初版の記載内容に複数個所ミスが見つかりましたので、該当箇所を修正していますm(_
_)m