page112

第4章 生体分子の構造解析と分子シミュレーション

  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 核酸(nucleic acid)
    リボ核酸 (RNA)とデオキシリボ核酸 (DNA)の総称で、塩基と糖、リン酸からなるヌクレオチドがホスホジエステル結合で連なった生体高分子のことです。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 触媒(catalyst)
    一般に、特定の化学反応の反応速度を速める物質で、自身は反応の前後で変化しないもののことです。
  • 遺伝子(gene)
    大まかには「ゲノム上のタンパク質配列に対応する領域」です。より正確には「生体中で機能する産物を作り出すのに必要なDNA中の配列領域」という理解でよいと思います。
  • 遺伝子発現(gene expression)
    遺伝子の情報が細胞における構造および機能に変換される過程のことです。
  • 生体分子(biomolecule)
    タンパク質や代謝産物などの生体内で働く様々な有機化合物の総称という理解でよいです。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • 分子シミュレーション(molecular simulation)
    何らかの物理現象や物質が持つ物性などを分子の動きを数値計算することにより解析する試みのことです。本章では、「4.8 分子力学法」、「4.9 分子動力学法」、「4.10 立体構造予測」、「4.11 複合体構造予測」の総称として「分子シミュレーション」という言葉を用いています。根底にある概念という意味です。それゆえ、たとえば後のほうで出現する「分子動力学シミュレーション」という言葉は、「分子動力学法を用いた分子シミュレーション」という風に解釈すればよいです。

4.1 立体構造データベース

  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 核酸(nucleic acid)
    リボ核酸 (RNA)とデオキシリボ核酸 (DNA)の総称で、塩基と糖、リン酸からなるヌクレオチドがホスホジエステル結合で連なった生体高分子のことです。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • タンパク質データバンク(Protein Data Bank; PDB)Burley et al., Nucleic Acids Res., 2021
    タンパク質,核酸,糖鎖など生体高分子の3次元構造の原子座標(立体配座)を蓄積している国際的な公共のデータベース(DB)です。
  • W4.1

    PDBのWebサーバです。

    国・地域 名称 URL
    世界 wwPDB https://www.wwpdb.org/
    米国 RCSB PDB https://www.rcsb.org/
    欧州 PDBe https://www.ebi.ac.uk/pdbe/
    日本 PDBj https://pdbj.org/

  • 図4.1
    RCSB PDBのトップページです。
  • フレーズ(phrase)
    文法上の単語の集まりのことです。「句(く)」ともいいます。
  • 識別子(identifier)
    ある実体の集合の中で、特定の元(げん、と読みますがこの場合は要素という理解でよいです)を他の元(げん、要素という理解でよいです)から曖昧さ無く区別することを可能とする、その実体に関連する属性の集合のことです。「ID」ともいいます。
  • 1HVR
    HIV proteaseのエントリの1つです。
page113

4.2 立体構造ビューア

  • RCSB PDB
    本章で主に用いている立体構造データベースです。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • 1HVR
    HIV proteaseのエントリの1つです。
  • オペレーティングシステム(operating system; OS)
    コンピュータのオペレーション(操作・運用・運転)を司るシステムソフトウェアです。
  • W4.2

    立体構造ビューアです。*PyMolは教育目的利用を除き有料、**UCSF Chimeraは非商用利用のみです。

    名称 URL
    CueMol http://www.cuemol.org/ja/
    PyMol* https://pymol.org/2/
    RasMol http://www.openrasmol.org/
    Swiss-PdbViewer https://spdbv.vital-it.ch/
    UCSF Chimera** https://www.cgl.ucsf.edu/chimera/

  • UCSF Chimera
    本章で主に用いている立体構造ビューアです。
  • 図4.2
    UCSF Chimeraで1hvr.pdbを開いた様子です。1hvr.pdbのファイルは1HVRから取得可能です。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 主鎖(main chain)
    タンパク質は20種類のα-アミノ酸が鎖状に多数連結(重合)してできた高分子化合物ですが、この鎖を構成しているのは、α-アミノ酸のRCH(NH2)COOH という構造のうち、側鎖に相当するR以外の部分になります。このR以外の部分を主鎖といいます。
  • アミノ酸残基(amino acid residue)
    リンク先は「残基」です。タンパク質は構成単位であるモノマーが多数連結(重合)してできた高分子化合物であり、化学結合の構造部分とそれ以外の部分に分けられます。このうち後者の「化学結合以外の部分構造」のことを残基といいます。タンパク質はアミノ酸から合成されるので、残基はポリペプチドのアミド結合(ペプチド結合)以外のアミノ酸構造を意味します。また、タンパク質は、その残基部分の特性によって様々に変化するため、「アミノ酸残基」という表現がよくなされます。
  • αヘリックス(alpha helix)
    タンパク質の二次構造の共通モチーフの1つで、ばねに似た右巻きらせんの形をしています。骨格となるアミノ酸のすべてのアミノ基は、4残基離れたカルボキシ基と水素結合を形成しています。
  • βストランド(beta strand)
    リンク先は「βシート」です。βストランドは、一般的に3~10アミノ酸長のポリペプチド鎖の区間であり、骨格は伸長したコンフォメーション(立体配座)になっています。タンパク質の二次構造の共通モチーフの1つです。ちなみに、βシートは、βストランドがいくつか横方向に結合して構成されたもののことです。
  • コイル(coil)
    リンク先は「ランダムコイル」です。ポリマーを構成するモノマーが隣接したモノマーと結合しながらランダムに配向したものです。1つの決まった形というのはありませんが、分子全体の統計的な分布というものは考えられます。αヘリックスやβシートのような二次構造をとっていない領域がコイルだという理解でよいです。

page114
  • 図4.2
    UCSF Chimeraで1hvr.pdbを開いた様子です。1hvr.pdbのファイルは1HVRから取得可能です。

  • 静電ポテンシャル(electrostatic potential)
    リンク先は「電位」です。電荷に係る位置エネルギーのことです。

  • アミノ酸配列(amino acid sequence)
    リンク先は「一次構造」です。一次構造は、生体分子の特定の単位とそれらをつなぐ化学結合の正確な配置のことです。タンパク質の場合は、ポリマーの分岐や交差がないため、アミノ酸残基の並びと同義です。
  • サブユニット(subunit)
    他のタンパク質と会合して多量体タンパク質やオリゴマータンパク質を形成する単一のタンパク質分子のことです。
  • ホモ2量体(homodimer)
    2つの同種の分子やサブユニット(単量体)が物理的・化学的な力によってまとまった分子または超分子のことです。
  • ペプチド(peptide)
    アミノ酸がペプチド結合により短い鎖状につながった分子の総称です。
  • ポリペプチド鎖(polypeptide chain)
    実質的にタンパク質の一次構造と同じ意味です。
  • αヘリックス(alpha helix)
    タンパク質の二次構造の共通モチーフの1つで、ばねに似た右巻きらせんの形をしています。骨格となるアミノ酸のすべてのアミノ基は、4残基離れたカルボキシ基と水素結合を形成しています。
  • βストランド(beta strand)
    リンク先は「βシート」です。βストランドは、一般的に3~10アミノ酸長のポリペプチド鎖の区間であり、骨格は伸長したコンフォメーション(立体配座)になっています。タンパク質の二次構造の共通モチーフの1つです。ちなみに、βシートは、βストランドがいくつか横方向に結合して構成されたもののことです。

page115
  • 識別子(identifier)
    ある実体の集合の中で、特定の元(げん、と読みますがこの場合は要素という理解でよいです)を他の元(げん、要素という理解でよいです)から曖昧さ無く区別することを可能とする、その実体に関連する属性の集合のことです。「ID」ともいいます。
  • 1HVR
    HIV proteaseのエントリの1つです。
  • UCSF Chimera
    本章で主に用いている立体構造ビューアです。

4.3 立体構造データフォーマット

  • PDB Format
    タンパク質立体構造データベースであるPDBが利用しているファイル形式のことです。
  • W4.3
    PDBレコードの説明(簡易版)です。
  • ポリペプチド鎖(polypeptide chain)
    実質的にタンパク質の一次構造と同じ意味です。
  • W4.4
    macromolecular Crystallographic Information Format(mmCIF)です。

4.4 立体構造決定法

  • PDB
    RCSB PDBにリンクを張っています。タンパク質,核酸,糖鎖など生体高分子の3次元構造の原子座標(立体配座)を蓄積している国際的な公共のデータベース(DB)です。
  • 表4.1

    2021年8月における立体構造決定法ごとのエントリ数と全体に対する割合です。

    立体構造決定法 エントリ数 割合
    X線結晶構造解析法 158,913 87.8%
    NMR法 13,451 7.4%
    電子顕微鏡法 8,290 4.6%
    その他 299 0.2%
    合計 180,953 100.0%

  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • 核磁気共鳴(nuclear magnetic resonance; NMR)
    外部静磁場に置かれた原子核が固有の周波数の電磁波と相互作用する現象です。核磁気共鳴は発見当初は原子核の内部構造を研究するための実験的手段と考えられていました。その後、原子核のラーモア周波数がその原子の化学結合状態などによってわずかながらも変化すること(化学シフト)が発見され、核磁気共鳴を物質の分析、同定の手段として用いることが考案されました。このように核磁気共鳴によるスペクトルを得る分光法を核磁気共鳴分光法と呼び、これも単にNMRと略称することが多いです。本文中で述べているNMRは、この分光法のことも指します。
  • 低温電子顕微鏡法(Cryo-electron microscopy; cryo-EM)
    透過型電子顕微鏡法の一種で、試料を低温(多くの場合液体窒素の温度)において解析する手法です。「クライオ電子顕微鏡法」ともいいます。生物学におけるクライオ電子顕微鏡法では、試料を染色せず、凍結することで「固定」して試料を観察すします。このため、通常の染色や化学固定をして試料を作製する電子顕微鏡法と比べると、より生体内に近い試料の構造を観察出来ると考えられています。
  • 単粒子解析法(single particle analysis; SPA)
    3次元電子顕微鏡法の1つです。透過型電子顕微鏡(TEM)下で多数の均一な粒子を観察、撮影し、画像処理によって粒子の詳細な構造を得る手法です。単一の撮影像よりも分解能を向上させることができるほか、様々な方向を向いた粒子を撮影することで、3次元立体構造を把握することも可能となります。低温電子顕微鏡法(cryo-EM)の利用とともに主にタンパク質などの生体高分子やウイルスなどの解析に用いられ、近年各種解析手法や検出器の向上により分解能が原子分解能を達成しました。
page116
  • 表4.1

    2021年8月における立体構造決定法ごとのエントリ数と全体に対する割合です。

    立体構造決定法 エントリ数 割合
    X線結晶構造解析法 158,913 87.8%
    NMR法 13,451 7.4%
    電子顕微鏡法 8,290 4.6%
    その他 299 0.2%
    合計 180,953 100.0%

4.4.1 X線結晶構造解析法

  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • X線(X-ray)
    波長が1pm - 10nm程度の電磁波です。発見者であるヴィルヘルム・レントゲンの名をとってレントゲン線とよばれることもあります。
  • 電子(electron)
    宇宙を構成するレプトンに分類される素粒子です。素粒子標準模型では、第一世代の荷電レプトンに位置付けられます。
  • 電子密度(electron density)
    単位体積当たりの電子数のことです。
  • 水素原子(hydrogen atom)
    水素の原子であり、1つの陽子と1つの電子により構成されています。水素原子は宇宙の全質量の約75%を占めます。
  • 炭素(carbon)
    原子番号6の元素です。元素記号はC。原子量は12.01です。単体・化合物両方においてきわめて多様な形状をとることができます。融点や昇華を起こす温度は全元素の中でもっとも高いです。
  • 窒素(nitrogen)
    原子番号7の元素である。元素記号はN。原子量は14.007です。地球の大気中に安定した気体として存在するほか、生物に欠かせないアミノ酸、アンモニアなど様々な化合物を構成します。ハーバー・ボッシュ法によりアンモニアの量産が可能になって以降、人間により工業的に産生された窒素肥料や窒素酸化物が大量に投入・排出され、自然環境にも大きな影響を与えています。
  • 酸素(oxygen)
    原子番号8の元素です。元素記号はO。原子量は16.00です。この場合は酸素分子O2の文脈で用いています。これは、常温常圧では無色無臭で助燃性をもつ気体として存在します。
  • 硫黄(sulfur)
    原子番号16の元素です。元素記号はS。原子量は32.1です。酸素族元素の1つです。淡黄色で無味無臭であり、たびたび誤用される温泉街などで感じる「硫黄の臭い」は硫黄と水素の化合物である硫化水素によるものです。
  • リン(phosphorus)
    原子番号15の元素です。元素記号はP。原子量は30.97です。窒素族元素(15族)の1つです。生体内では、遺伝情報の要であるDNAやRNAのポリリン酸エステル鎖として存在するほか、生体エネルギー代謝に欠かせないATP、細胞膜の主要な構成要素であるリン脂質など、重要な働きを担う化合物中に存在しています。また、脊椎動物ではリン酸カルシウムが骨格の主要構成要素としての役割ももちます。このため、あらゆる生物にとっての必須元素であり、地球上におけるリンの存在量が、地球生態系のバイオマスの限界量を決定すると言われています。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • PDB
    RCSB PDBにリンクを張っています。タンパク質,核酸,糖鎖など生体高分子の3次元構造の原子座標(立体配座)を蓄積している国際的な公共のデータベース(DB)です。
  • 非対称単位(asymmetric unit)
    結晶構造の最も小さな単位構造のことです。
  • UCSF Chimera
    本章で主に用いている立体構造ビューアです。
  • 図4.3
    Chymotrypsin inhibitor 2 (PDB ID: 2CI2)の結晶中の並びです。
  • 2CI2
    chymotrypsin inhibitor 2のPDB IDです。
  • 分子間相互作用(intermolecular interaction)
    リンク先は「分子間力」です。分子どうしや高分子内の離れた部分の間に働く電磁気学的な相互作用のことです。
  • 水素結合(hydrogen bond)
    電気陰性度が大きな原子(陰性原子)に共有結合で結びついた水素原子が、近傍に位置した窒素、酸素、硫黄、フッ素、π電子系などの孤立電子対とつくる非共有結合性の引力的相互作用です。水素結合には、異なる分子の間に働くもの(分子間力)と単一の分子の異なる部位の間(分子内)に働くものがあります。

  • biological assemblyまたはbiological unit
    生物学的に機能しうる最小限の分子構成のことです。
  • HIV protease
    リンク先は「HIV-1 protease」です。エイズ(AIDS)治療の標的タンパク質です。
  • ホモ2量体(homodimer)
    2つの同種の分子やサブユニット(単量体)が物理的・化学的な力によってまとまった分子または超分子のことです。
  • サブユニット(subunit)
    他のタンパク質と会合して多量体タンパク質やオリゴマータンパク質を形成する単一のタンパク質分子のことです。
  • 会合
    この場合は、2つの同種の分子やサブユニット(単量体)が物理的・化学的な力によってまとまっているさまのことです。
  • ホモ多量体(homopolymer)
    同種の分子やサブユニット(単量体)が物理的・化学的な力によって2個以上まとまった分子または超分子のことです。ホモ多量体は、ホモ2量体を含みます。
  • 3PHV
    HIV proteaseのエントリの1つです。
  • RCSB PDB
    本章で主に用いている立体構造データベースです。
  • UCSF Chimera
    本章で主に用いている立体構造ビューアです。
  • 図4.3
    Chymotrypsin inhibitor 2 (PDB ID: 2CI2)の結晶中の並びです。

page117
  • コンフォメーション(conformation)
    リンク先は「立体配座」です。単結合についての回転や孤立電子対を持つ原子についての立体反転によって相互に変換可能な空間的な原子の配置のことです。立体配座は結合の回転に起因する自由度により、その取りうる状態の数が規定されます。したがって、取りうる立体配座の数は低分子から高分子へと分子を構成する単結合が増えるにつれて爆発的に増大します。
  • X線回折(X-ray diffraction)
    X線が結晶格子で回折を示す現象のことです。X線の回折の結果を解析して結晶内部で原子がどのように配列しているかを決定する手法をX線結晶構造解析あるいはX線回折法といいます。
  • 電子密度(electron density)
    単位体積当たりの電子数のことです。
  • PDB Format
    タンパク質立体構造データベースであるPDBが利用しているファイル形式のことです。
  • 識別子(identifier)
    ある実体の集合の中で、特定の元(げん、と読みますがこの場合は要素という理解でよいです)を他の元(げん、要素という理解でよいです)から曖昧さ無く区別することを可能とする、その実体に関連する属性の集合のことです。「ID」ともいいます。
  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • 欠失原子(missing atom)
    多くのコンフォメーションの間を交換している、すなわち運動性が高い場合は、これらのコンフォメーションの範囲に電子密度が薄く広がるため、それぞれのコンフォメーションの位置を決めることができない原子のことを指します。
  • 残基(residue)
    この場合は、アミノ酸残基のことを指します。タンパク質はアミノ酸から合成されるので、残基はポリペプチドのアミド結合(ペプチド結合)以外のアミノ酸構造のことです。
  • 欠失残基(missing residue)
    残基全体の原子が欠失している場合に、その残基のことを欠失残基とよびます。

  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • 回折(diffraction)
    この場合は、X線回折(X-ray diffraction)で得られたデータのことを指します。つまり、X線が結晶格子で回折を示す現象を記録したデータのことです。
  • 分解能(optical resolution)
    装置などで対象を測定または識別できる能力。顕微鏡、望遠鏡、回折格子などにおける能力の指標の1つです。
  • 熱運動(thermal motion)
    タンパク質を構成する原子や分子の運動のことです。
  • 温度因子(temperature factor)
    リンク先は「デバイ‐ワラー因子」です。熱振動によるX線や中性子の散乱強度の減衰を表す因子のことです。結晶では原子の熱振動によってその電子は静止原子より広い空間に広がって分布します。X線回折などにおいて、回折角の大きい反射では同一の原子内でも各電子の散乱X線の位相のずれが大きくなり、回折強度が減少します。静止原子の構造因子\(f\)を用いると、実在の原子構造因子は\(f\)よりも小さくなり、\(f \cdot e^{-M}\)という形で表されます。この\(e^{-M}\)が温度因子です。温度因子\(B\)と座標のゆらぎ\(\overline{\Delta r}\)は、以下の式で関係づけられます。
    \[ B = \frac{8 \pi^2}{3}(\overline{\Delta r})^2 \]
  • 欠失原子(missing atom)
    多くのコンフォメーションの間を交換している、すなわち運動性が高い場合は、これらのコンフォメーションの範囲に電子密度が薄く広がるため、それぞれのコンフォメーションの位置を決めることができない原子のことを指します。

4.4.2 NMR法

  • NMR
    核磁気共鳴(nuclear magnetic resonance)のことです。外部静磁場に置かれた原子核が固有の周波数の電磁波と相互作用する現象です。核磁気共鳴は発見当初は原子核の内部構造を研究するための実験的手段と考えられていました。その後、原子核のラーモア周波数がその原子の化学結合状態などによってわずかながらも変化すること(化学シフト)が発見され、核磁気共鳴を物質の分析、同定の手段として用いることが考案されました。このように核磁気共鳴によるスペクトルを得る分光法を核磁気共鳴分光法と呼び、これも単にNMRと略称することが多いです。本文中で述べているNMRは、この分光法のことも指します。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 溶液(solution)
    2つ以上の物質から構成される液体状態の混合物です。一般的には主要な液体成分の溶媒(solvent)と、その他の気体、液体、固体の成分である溶質(solute)とから構成されます。
  • 水素(hydrogen)
    、原子番号1の元素です。元素記号はH。原子量は1.00794です。非金属元素の1つです。一般的に「水素」と言う場合、元素としての水素の他にも水素の単体である水素分子(水素ガス)H2、1個の陽子を含む原子核と1個の電子からなる水素原子、水素の原子核(ふつう1個の陽子、プロトン)などに言及している可能性があるため、文脈に基づいて判断する必要があります。
  • 原子核(atomic nucleus)
    単に核(かく、(英:nucleus)ともいい、電子と共に原子を構成している。原子の中心に位置する核子の塊であり、正の電荷を帯びています。原子核は原子と比べて非常に小さいです。
  • 水素原子(hydrogen atom)
    水素の原子であり、1つの陽子と1つの電子により構成されています。水素原子は宇宙の全質量の約75%を占めます。
  • 核スピン(nuclear spin)
    原子核は正電荷をもち自転することで、磁場を発生させています。つまり各々の原子は小さな磁石のようなものです。このような原子核がもっている向きをもった物理量(角運動量)のことです。核磁気モーメントともいいます。
  • 励起エネルギー(excited energy)
    リンク先は「励起状態」です。原子をある状態(たとえば基底状態)からより高いエネルギー状態(励起状態)に移すのに要するエネルギーという理解でよいです。励起後、原子は特徴的なエネルギーを持つフォトンを放出することによって、基底状態あるいはより低い励起状態に戻ります。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • NMR構造(NMR structure)
    NMR法で決定された立体構造のことです。
  • PDB
    RCSB PDBにリンクを張っています。タンパク質,核酸,糖鎖など生体高分子の3次元構造の原子座標(立体配座)を蓄積している国際的な公共のデータベース(DB)です。
  • エントリ(entry)
    DBのアクセッション番号(accession number)や識別子(identifier; ID)のようなものだという理解でよいです。
  • 残基(residue)
    この場合は、アミノ酸残基のことを指します。タンパク質はアミノ酸から合成されるので、残基はポリペプチドのアミド結合(ペプチド結合)以外のアミノ酸構造のことです。

  • 図4.4
    ヒトSrcのSH2ドメインのNMR構造です(PDB ID: 1HCT)。
  • NMR
    核磁気共鳴(nuclear magnetic resonance)のことです。外部静磁場に置かれた原子核が固有の周波数の電磁波と相互作用する現象です。核磁気共鳴は発見当初は原子核の内部構造を研究するための実験的手段と考えられていました。その後、原子核のラーモア周波数がその原子の化学結合状態などによってわずかながらも変化すること(化学シフト)が発見され、核磁気共鳴を物質の分析、同定の手段として用いることが考案されました。このように核磁気共鳴によるスペクトルを得る分光法を核磁気共鳴分光法と呼び、これも単にNMRと略称することが多いです。本文中で述べているNMRは、この分光法のことも指します。
  • ヒト(human)
    広義にはヒト亜族(Hominina)に属する動物の総称であり、狭義には現生人類(Homo sapiens)のことです。
  • Src
    リンク先は「Src (遺伝子)」です。ヒトにおいてSRC遺伝子にコードされる非受容体型チロシンキナーゼタンパク質です。がん原遺伝子c-Srcあるいは単にc-Srcとしても知られています。このタンパク質は他のタンパク質の特定のチロシン残基をリン酸化します。c-Srcチロシンキナーゼの活性の上昇は、他のシグナルを促進することによってがんの進行と関連していることが示唆されています。
  • Src homology 2(SH2)
    リンク先は「SH2ドメイン」です。SH2ドメインは、100アミノ酸残基からなるタンパク質ドメインの1つです。がん遺伝子由来のタンパク質SrcとFpsの共通配列として発見されました。同様の構造を持つタンパク質は後にシグナル伝達に関わるタンパク質など、細胞間タンパク質より多数発見されています。SH2は標的遺伝子のモチーフに存在するリン酸化されたチロシンに結合する。SH2ドメインは、現在知られている最も大きなリン酸化チロシン認識ドメインです。SH2ドメインとシグナル伝達におけるその様々な役割の発見は、複雑なシグナルネットワークを構築するのに生物がどのようにドメイン間の相互作用を利用したのかという重要な概念につながっています。
  • ドメイン(domain)
    リンク先は「タンパク質ドメイン」です。タンパク質の配列、構造の一部で他の部分とは独立に進化し、機能を持った存在です。それぞれのドメインはコンパクトな三次元構造を作り、独立に折りたたまれ、安定化されることが多いです。多くのタンパク質がいくつかのドメインより成り立ち、1つのドメインは進化的に関連した多くのタンパク質の中に現れます。ドメインの長さは様々で、25残基程度から500残基以上に及ぶものもあります。有名なジンクフィンガーのような最も短いドメインは、金属イオンやジスルフィド結合によって安定化されます。
  • 1HCT
    NMRで構造決定されたSH2ドメインのエントリの1つです。
  • エントリ(entry)
    DBのアクセッション番号(accession number)や識別子(identifier; ID)のようなものだという理解でよいです。
  • コンフォメーション(conformation)
    リンク先は「立体配座」です。単結合についての回転や孤立電子対を持つ原子についての立体反転によって相互に変換可能な空間的な原子の配置のことです。立体配座は結合の回転に起因する自由度により、その取りうる状態の数が規定されます。したがって、取りうる立体配座の数は低分子から高分子へと分子を構成する単結合が増えるにつれて爆発的に増大します。
  • ポリペプチド鎖(polypeptide chain)
    実質的にタンパク質の一次構造と同じ意味です。
page118
  • 図4.4
    ヒトSrcのSH2ドメインのNMR構造です(PDB ID: 1HCT)。
  • 図4.5
    ヒトSrcのSH2ドメインの結晶構造(白色)へのNMR構造(灰色)の重ね合わせ結果です。

  • C\(\alpha\)原子
    リンク先は「タンパク質構造」です。ここの「側鎖のコンフォメーション」という項目で、C\(\alpha\)原子(しーあるふぁげんし、と読む)を含む解説があります。C\(\alpha\)はアミノ酸のカルボキシル基に最も近い炭素原子を表し、通常は主鎖の一部であると考えられています。
  • 根平均二乗変位(root mean square deviation; RMSD)
    リンク先は「原子位置の平均二乗偏差」です。この業界では、RMSD(あーるえむえすでぃー、と読みます)という用語が一般的です。数値が低ければ低いほど精度がよいと判断します。最小値は0 Å(オングストローム)です。
    \[ {\rm{RMSD}} = \sqrt{\frac{1}{n(A)} \sum_{i \in A} |\boldsymbol{\rm r}_i - \langle \boldsymbol{\rm r}_i \rangle|^2} \] 以下は記号の説明です:
    • \(A\)
      RMSDの計算に用いる原子の番号の集合です。
    • \(n(A)\)
      \(A\)に含まれる原子の個数です。
    • \(\boldsymbol{\rm r}_i\)
      \(i\)番目の原子の座標です。
    • \(\langle \boldsymbol{\rm r}_i \rangle\)
      \(i\)番目の原子の平均構造の座標です。以下の式で与えられます。
      \[ \langle \boldsymbol{\rm r}_i \rangle = \frac{1}{n(A)} \sum_{i \in A} \boldsymbol{\rm r}_i \]
  • ヒト(human)
    広義にはヒト亜族(Hominina)に属する動物の総称であり、狭義には現生人類(Homo sapiens)のことです。
  • Src
    リンク先は「Src (遺伝子)」です。ヒトにおいてSRC遺伝子にコードされる非受容体型チロシンキナーゼタンパク質です。がん原遺伝子c-Srcあるいは単にc-Srcとしても知られています。このタンパク質は他のタンパク質の特定のチロシン残基をリン酸化します。c-Srcチロシンキナーゼの活性の上昇は、他のシグナルを促進することによってがんの進行と関連していることが示唆されています。
  • SH2ドメイン
    リンク先は「SH2ドメイン」です。SH2ドメインは、100アミノ酸残基からなるタンパク質ドメインの1つです。がん遺伝子由来のタンパク質SrcとFpsの共通配列として発見されました。同様の構造を持つタンパク質は後にシグナル伝達に関わるタンパク質など、細胞間タンパク質より多数発見されています。SH2は標的遺伝子のモチーフに存在するリン酸化されたチロシンに結合する。SH2ドメインは、現在知られている最も大きなリン酸化チロシン認識ドメインです。SH2ドメインとシグナル伝達におけるその様々な役割の発見は、複雑なシグナルネットワークを構築するのに生物がどのようにドメイン間の相互作用を利用したのかという重要な概念につながっています。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • 1SHD
    X線結晶構造解析法で構造決定されたSH2ドメインのエントリの1つです。
  • 1HCT
    NMRで構造決定されたSH2ドメインのエントリの1つです。
  • UCSF Chimera
    本章で主に用いている立体構造ビューアです。
  • MacthMakerMeng et al., Bioinformatics, 2006
    UCSF Chimeraの立体構造重ね合わせツールです。
  • 図4.5
    ヒトSrcのSH2ドメインの結晶構造(白色)へのNMR構造(灰色)の重ね合わせ結果です。
  • RMSD
    リンク先は「原子位置の平均二乗偏差」です。根平均二乗変位(root mean square deviation)のことです。この業界では、RMSD(あーるえむえすでぃー、と読みます)という用語が一般的です。数値が低ければ低いほど精度がよいと判断します。最小値は0Å(オングストローム)です。
page119
  • 図4.6
    結晶構造(実線)とNMR構造(破線)におけるC\(\alpha\)原子のゆらぎの比較です。

  • C\(\alpha\)原子
    リンク先は「タンパク質構造」です。ここの「側鎖のコンフォメーション」という項目で、C\(\alpha\)原子(しーあるふぁげんし、と読む)を含む解説があります。C\(\alpha\)はアミノ酸のカルボキシル基に最も近い炭素原子を表し、通常は主鎖の一部であると考えられています。
  • 結晶構造(crystal structure)
    X線結晶構造解析法で決定された立体構造のことです。
  • 残基(residue)
    この場合は、アミノ酸残基のことを指します。タンパク質はアミノ酸から合成されるので、残基はポリペプチドのアミド結合(ペプチド結合)以外のアミノ酸構造のことです。
  • NMR構造(NMR structure)
    NMR法で決定された立体構造のことです。
  • 欠失残基(missing residue)
    残基全体の原子が欠失している場合に、その残基のことを欠失残基とよびます。
  • 欠失原子(missing atom)
    多くのコンフォメーションの間を交換している、すなわち運動性が高い場合は、これらのコンフォメーションの範囲に電子密度が薄く広がるため、それぞれのコンフォメーションの位置を決めることができない原子のことを指します。
  • 図4.6
    結晶構造(実線)とNMR構造(破線)におけるC\(\alpha\)原子のゆらぎの比較結果です。
  • 温度因子(temperature factor)
    リンク先は「デバイ‐ワラー因子」です。熱振動によるX線や中性子の散乱強度の減衰を表す因子のことです。結晶では原子の熱振動によってその電子は静止原子より広い空間に広がって分布します。X線回折などにおいて、回折角の大きい反射では同一の原子内でも各電子の散乱X線の位相のずれが大きくなり、回折強度が減少します。静止原子の構造因子 f を用いると、実在の原子構造因子は f よりも小さくなりますが、この因子に相当するものが温度因子です。
  • NMR
    核磁気共鳴(nuclear magnetic resonance)のことです。外部静磁場に置かれた原子核が固有の周波数の電磁波と相互作用する現象です。核磁気共鳴は発見当初は原子核の内部構造を研究するための実験的手段と考えられていました。その後、原子核のラーモア周波数がその原子の化学結合状態などによってわずかながらも変化すること(化学シフト)が発見され、核磁気共鳴を物質の分析、同定の手段として用いることが考案されました。このように核磁気共鳴によるスペクトルを得る分光法を核磁気共鳴分光法と呼び、これも単にNMRと略称することが多いです。本文中で述べているNMRは、この分光法のことも指します。

4.4.3 電子顕微鏡法

  • 低温電子顕微鏡法(Cryo-electron microscopy; cryo-EM)
    透過型電子顕微鏡法の一種で、試料を低温(多くの場合液体窒素の温度)において解析する手法です。「クライオ電子顕微鏡法」ともいいます。生物学におけるクライオ電子顕微鏡法では、試料を染色せず、凍結することで「固定」して試料を観察すします。このため、通常の染色や化学固定をして試料を作製する電子顕微鏡法と比べると、より生体内に近い試料の構造を観察出来ると考えられています。
  • 単粒子解析法(single particle analysis; SPA)
    3次元電子顕微鏡法の1つです。透過型電子顕微鏡(TEM)下で多数の均一な粒子を観察、撮影し、画像処理によって粒子の詳細な構造を得る手法です。単一の撮影像よりも分解能を向上させることができるほか、様々な方向を向いた粒子を撮影することで、3次元立体構造を把握することも可能となります。低温電子顕微鏡法(cryo-EM)の利用とともに主にタンパク質などの生体高分子やウイルスなどの解析に用いられ、近年各種解析手法や検出器の向上により分解能が原子分解能を達成しました。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 溶液(solution)
    2つ以上の物質から構成される液体状態の混合物です。一般的には主要な液体成分の溶媒(solvent)と、その他の気体、液体、固体の成分である溶質(solute)とから構成されます。
  • 非晶質(non-crystalline)
    リンク先は「アモルファス(amorphous)」です。結晶のような長距離秩序はないが、短距離秩序はある物質の状態のことです。
  • 電子顕微鏡(electron microscope)
    通常の顕微鏡(光学顕微鏡)では、観察したい対象に光(可視光線)をあてて拡大するのに対し、光の代わりに電子(電子線)をあてて拡大する顕微鏡のことです。
  • 電子線
    リンク先は「陰極線(cathode ray)」です。真空管の中で観察される電子の流れのことです。電子線・陰極線・電子ビームともよばれます。
  • 電子(electron)
    宇宙を構成するレプトンに分類される素粒子です。素粒子標準模型では、第一世代の荷電レプトンに位置付けられます。
  • 電子密度(electron density)
    単位体積当たりの電子数のことです。
  • 射影(projection)
    物体に光を当ててその影を映すこと、またその影のことです。
  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • 電子顕微鏡データバンク(Electron Microscopy Data Bank; EMDB)
    電子密度図のデータのリポジトリです。
  • 原子分解能(atomic resolution)
    タンパク質の個々の原子の位置を明確に識別できる程度の解像度だという意味です。
  • 複合体(complex)
    この場合は、複数のタンパク質単体が1つの塊となって(機能して)いる状態や、タンパク質と低分子化合物が1つの塊となって(機能して)いる状態の形(立体構造)のことを指します。
page120

4.5 配列データベースとの連携

  • RCSB PDB
    本章で主に用いている立体構造データベースです。
  • エントリ(entry)
    DBのアクセッション番号(accession number)や識別子(identifier; ID)のようなものだという理解でよいです。
  • UniProt Knowledgebase(UniProtKB)
  • ヒト(human)
    広義にはヒト亜族(Hominina)に属する動物の総称であり、狭義には現生人類(Homo sapiens)のことです。
  • Src
    リンク先は「Src (遺伝子)」です。ヒトにおいてSRC遺伝子にコードされる非受容体型チロシンキナーゼタンパク質です。がん原遺伝子c-Srcあるいは単にc-Srcとしても知られています。このタンパク質は他のタンパク質の特定のチロシン残基をリン酸化します。c-Srcチロシンキナーゼの活性の上昇は、他のシグナルを促進することによってがんの進行と関連していることが示唆されています。
  • Src homology 2(SH2)
    リンク先は「SH2ドメイン」です。SH2ドメインは、100アミノ酸残基からなるタンパク質ドメインの1つです。がん遺伝子由来のタンパク質SrcとFpsの共通配列として発見されました。同様の構造を持つタンパク質は後にシグナル伝達に関わるタンパク質など、細胞間タンパク質より多数発見されています。SH2は標的遺伝子のモチーフに存在するリン酸化されたチロシンに結合する。SH2ドメインは、現在知られている最も大きなリン酸化チロシン認識ドメインです。SH2ドメインとシグナル伝達におけるその様々な役割の発見は、複雑なシグナルネットワークを構築するのに生物がどのようにドメイン間の相互作用を利用したのかという重要な概念につながっています。
  • 1SHD
    X線結晶構造解析法で構造決定されたSH2ドメインのエントリの1つです。
  • P12931
    UniProtKBにあるヒトSrcのエントリです。
  • 1HCT
    NMRで構造決定されたSH2ドメインのエントリの1つです。
  • PDBe
    欧州のPDBです。
  • PDBj
    日本のPDBです。

  • アミノ酸配列(amino acid sequence)
    リンク先は「一次構造」です。一次構造は、生体分子の特定の単位とそれらをつなぐ化学結合の正確な配置のことです。タンパク質の場合は、ポリマーの分岐や交差がないため、アミノ酸残基の並びと同義です。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • BLASTAltschul et al., J Mol Biol., 1990
    NCBI BLASTにリンクを張っています。BLASTは、Basic Local Alignment Search Toolの略です。「ぶらすと」と読みます。DNAの塩基配列あるいはタンパク質のアミノ酸配列のシーケンスアラインメントを行うためのアルゴリズム、またはそのアルゴリズムを実装したプログラムのことです。
  • 図4.7
    ヒトSrcのSH2ドメイン144~249残基のアミノ酸配列を用いてBLAST検索を行った結果です。
  • ヒト(human)
    広義にはヒト亜族(Hominina)に属する動物の総称であり、狭義には現生人類(Homo sapiens)のことです。
  • Src
    リンク先は「Src (遺伝子)」です。ヒトにおいてSRC遺伝子にコードされる非受容体型チロシンキナーゼタンパク質です。がん原遺伝子c-Srcあるいは単にc-Srcとしても知られています。このタンパク質は他のタンパク質の特定のチロシン残基をリン酸化します。c-Srcチロシンキナーゼの活性の上昇は、他のシグナルを促進することによってがんの進行と関連していることが示唆されています。
  • Src homology 2(SH2)
    リンク先は「SH2ドメイン」です。SH2ドメインは、100アミノ酸残基からなるタンパク質ドメインの1つです。がん遺伝子由来のタンパク質SrcとFpsの共通配列として発見されました。同様の構造を持つタンパク質は後にシグナル伝達に関わるタンパク質など、細胞間タンパク質より多数発見されています。SH2は標的遺伝子のモチーフに存在するリン酸化されたチロシンに結合する。SH2ドメインは、現在知られている最も大きなリン酸化チロシン認識ドメインです。SH2ドメインとシグナル伝達におけるその様々な役割の発見は、複雑なシグナルネットワークを構築するのに生物がどのようにドメイン間の相互作用を利用したのかという重要な概念につながっています。
  • 配列一致度(sequence identity)
    比較する2本の配列が似ている度合いを表す指標の1つです。配列のアラインメントをとったとき、対応する文字が一致する割合を示すものです。分子(numerator)が「対応する文字が一致する数」、分母(denominator)が「アラインメントの長さ」です。
  • クエリ配列(query sequence)
    DBに問い合わせる配列のことです。この場合は、「ヒトSrcのSH2ドメイン144~249残基のアミノ酸配列」です。
  • アラインメント(alignment)
    リンク先は「シーケンスアラインメント」です。手元に複数の塩基配列(またはアミノ酸配列)があったときに、類似した領域を特定できるように並べたもの(または並べること)です。
  • 1A07
    X線結晶構造解析法で構造決定されたSH2ドメインのエントリの1つです。
  • チェイン(chain)
    この場合は、「ポリペプチド鎖」のことです。
  • 結晶構造(crystal structure)
    X線結晶構造解析法で決定された立体構造のことです。
  • 1SHD
    X線結晶構造解析法で構造決定されたSH2ドメインのエントリの1つです。
  • 1HCT
    NMRで構造決定されたSH2ドメインのエントリの1つです。

  • 図4.7
    ヒトSrcのSH2ドメイン144~249残基のアミノ酸配列を用いてBLAST検索を行った結果です。
page121

4.6 立体構造比較

  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • 並進(translation)
    この場合は、(比較したい2つの立体構造のうちの)一方を全体として平行移動させて、もう一方の立体構造に全体として近づけていくことです。
  • RMSD
    リンク先は「原子位置の平均二乗偏差」です。根平均二乗変位(root mean square deviation)のことです。この業界では、RMSD(あーるえむえすでぃー、と読みます)という用語が一般的です。数値が低ければ低いほど精度がよいと判断します。最小値は0Å(オングストローム)です。
  • 回転行列(rotation matrix)
    ユークリッド空間内における原点中心の回転変換の表現行列のことです。
  • 立体構造Bを回転行列\(\boldsymbol{\rm U}\)で回転させ、並進ベクトル\(\boldsymbol{\rm t}\)で並進させたときの立体構造AとのRMSDは以下で与えられます。
    \[ {\rm{RMSD}} = \sqrt{\frac{1}{N} \sum_{i = 1}^N |\boldsymbol{\rm r}_{{\rm A}, a(i)} - [\boldsymbol{\rm U} \boldsymbol{\rm r}_{{\rm B}, b(i)} + \boldsymbol{\rm t}]|^2} \] 以下は記号の説明です:
    • \(N\)
      重ね合わせに用いる原子ペアの数です。
    • \(\boldsymbol{\rm r}_{\rm A}\)
      立体構造Aの座標です。
    • \(a(i)\)
      \(i\)番目の原子ペアの立体構造Aにおける原子の通し番号です。
    • \(\boldsymbol{\rm U}\)
      回転行列のことです。
    • \(\boldsymbol{\rm r}_{\rm B}\)
      立体構造Bの座標です。
    • \(b(i)\)
      \(i\)番目の原子ペアの立体構造Bにおける原子の通し番号です。
    • \(\boldsymbol{\rm t}\)
      並進ベクトルのことです。
  • Kabsch W, Acta Cryst., 1976
    Kabschの方法の論文です。
  • Kabsch W, Acta Cryst., 1978
    Kabschの方法の論文です。

  • ヒト(human)
    広義にはヒト亜族(Hominina)に属する動物の総称であり、狭義には現生人類(Homo sapiens)のことです。
  • Src
    リンク先は「Src (遺伝子)」です。ヒトにおいてSRC遺伝子にコードされる非受容体型チロシンキナーゼタンパク質です。がん原遺伝子c-Srcあるいは単にc-Srcとしても知られています。このタンパク質は他のタンパク質の特定のチロシン残基をリン酸化します。c-Srcチロシンキナーゼの活性の上昇は、他のシグナルを促進することによってがんの進行と関連していることが示唆されています。
  • Src homology 2(SH2)
    リンク先は「SH2ドメイン」です。SH2ドメインは、100アミノ酸残基からなるタンパク質ドメインの1つです。がん遺伝子由来のタンパク質SrcとFpsの共通配列として発見されました。同様の構造を持つタンパク質は後にシグナル伝達に関わるタンパク質など、細胞間タンパク質より多数発見されています。SH2は標的遺伝子のモチーフに存在するリン酸化されたチロシンに結合する。SH2ドメインは、現在知られている最も大きなリン酸化チロシン認識ドメインです。SH2ドメインとシグナル伝達におけるその様々な役割の発見は、複雑なシグナルネットワークを構築するのに生物がどのようにドメイン間の相互作用を利用したのかという重要な概念につながっています。
  • 結晶構造(crystal structure)
    X線結晶構造解析法で決定された立体構造のことです。
  • NMR構造(NMR structure)
    NMR法で決定された立体構造のことです。
  • UCSF Chimera
    本章で主に用いている立体構造ビューアです。
  • MacthMakerMeng et al., Bioinformatics, 2006
    UCSF Chimeraの立体構造重ね合わせツールです。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • アミノ酸配列(amino acid sequence)
    リンク先は「一次構造」です。一次構造は、生体分子の特定の単位とそれらをつなぐ化学結合の正確な配置のことです。タンパク質の場合は、ポリマーの分岐や交差がないため、アミノ酸残基の並びと同義です。
  • アラインメント(alignment)
    リンク先は「シーケンスアラインメント」です。手元に複数の塩基配列(またはアミノ酸配列)があったときに、類似した領域を特定できるように並べたもの(または並べること)です。
  • アミノ酸(amino acid)
    広義には、アミノ基とカルボキシ基の両方の官能基を持つ有機化合物の総称です。狭義には、生体のタンパク質の構成ユニットとなる「α-アミノ酸」のことを指します。α-アミノ酸は、カルボキシ基が結合している炭素(α炭素)にアミノ基も結合しているアミノ酸であり、RCH(NH2)COOH という構造をもちます。このうちRに相当する部分は側鎖とよばれます。
  • C\(\alpha\)原子
    リンク先は「タンパク質構造」です。ここの「側鎖のコンフォメーション」という項目で、C\(\alpha\)原子(しーあるふぁげんし、と読む)を含む解説があります。C\(\alpha\)はアミノ酸のカルボキシル基に最も近い炭素原子を表し、通常は主鎖の一部であると考えられています。

  • MacthMakerMeng et al., Bioinformatics, 2006
    UCSF Chimeraの立体構造重ね合わせツールです。
  • アラインメント(alignment)
    リンク先は「シーケンスアラインメント」です。手元に複数の塩基配列(またはアミノ酸配列)があったときに、類似した領域を特定できるように並べたもの(または並べること)です。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • アミノ酸配列(amino acid sequence)
    リンク先は「一次構造」です。一次構造は、生体分子の特定の単位とそれらをつなぐ化学結合の正確な配置のことです。タンパク質の場合は、ポリマーの分岐や交差がないため、アミノ酸残基の並びと同義です。
  • 主鎖構造
    C\(\alpha\)原子座標に基づく構造のことです。C\(\alpha\)原子はアミノ酸のカルボキシル基に最も近い炭素原子を表し、通常は主鎖の一部であると考えられていることを根拠としています。
  • RCSB PDB
    本章で主に用いている立体構造データベースです。
  • 立体構造の重ね合わせに用いる原子ペアを決めるツールのアルゴリズム
    • Flexible structure alignment by chaining aligned fragment pairs allowing twists (FATCAT)
    • Combinatorial extension (CE)
    • Template modeling score(TM-score)に基づくタンパク質立体構造アラインメント(TM-align)

  • 例題4.1
    1ページ目が問題、2ページ目以降が解答例です。
    • 1WW9
      カルバゾール1,9aジオキシゲナーゼの末端酸化酵素のPDBエントリです。
    • 1NDO
      ナフタレン1,2ジオキシゲナーゼのPDBエントリです。
    • blast2seq
      アミノ酸配列用のアラインメントツールです。

  • 配列一致度(sequence identity)
    比較する2本の配列が似ている度合いを表す指標の1つです。配列のアラインメントをとったとき、対応する文字が一致する割合を示すものです。分子(numerator)が「対応する文字が一致する数」、分母(denominator)が「アラインメントの長さ」です。
  • RMSD
    リンク先は「原子位置の平均二乗偏差」です。根平均二乗変位(root mean square deviation)のことです。この業界では、RMSD(あーるえむえすでぃー、と読みます)という用語が一般的です。数値が低ければ低いほど精度がよいと判断します。最小値は0Å(オングストローム)です。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • Gan et al., Biophys J., 2002
  • アミノ酸配列(amino acid sequence)
    リンク先は「一次構造」です。一次構造は、生体分子の特定の単位とそれらをつなぐ化学結合の正確な配置のことです。タンパク質の場合は、ポリマーの分岐や交差がないため、アミノ酸残基の並びと同義です。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • ドメイン(domain)
    リンク先は「タンパク質ドメイン」です。タンパク質の配列、構造の一部で他の部分とは独立に進化し、機能を持った存在です。それぞれのドメインはコンパクトな三次元構造を作り、独立に折りたたまれ、安定化されることが多いです。多くのタンパク質がいくつかのドメインより成り立ち、1つのドメインは進化的に関連した多くのタンパク質の中に現れます。ドメインの長さは様々で、25残基程度から500残基以上に及ぶものもあります。有名なジンクフィンガーのような最も短いドメインは、金属イオンやジスルフィド結合によって安定化されます。
  • Guo et al., Proteins, 2007
page122

4.7 立体構造分類データベース

  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • Raf-1
    リンク先は「RAF1」です。ヒトではRAF1遺伝子にコードされる酵素です。c-Raf (proto-oncogene c-RAF)という名称が用いられることもあり、他にもRAF proto-oncogene serine/threonine-protein kinase、Raf-1などともよばれます。c-RafはMAPK/ERK経路(ERK1/2経路)を構成し、Rasサブファミリーの下流のMAPキナーゼキナーゼキナーゼ(MAP3K)として機能します。他の多くのMAP3Kと同様、c-Rafは複数のドメインから構成されるタンパク質で、触媒活性の調節を補助する複数の付加的なドメインが存在する。N末端領域には、Ras結合ドメイン(RBD)とCキナーゼ相同ドメイン1(C1ドメイン)が隣接して存在します。
  • Ras結合ドメイン
    リンク先は「Rasタンパク質」です。Ras結合ドメインは、Rasタンパク質が結合する領域のことです。
  • 1GUA
    このタンパクのB鎖がRaf-1のRas結合ドメインです。
  • ユビキチン(ubiquitin)
    76個のアミノ酸からなるタンパク質です。他のタンパク質の修飾に用いられ、タンパク質分解、DNA修復、翻訳調節、シグナル伝達など様々な生命現象に関わっています。至る所にある(ubiquitous)ことからこの名前が付いたようです。
  • 1UBQ
    ユビキチンのPDBエントリです。
  • Protein G
    リンク先は「プロテインG」です。免疫グロブリンに結合するタンパク質で、C群およびG群のレンサ球菌によって作られます。プロテインAとよく似ていますが、特性は異なります。細胞表面にあるタンパク質で、分子量は65kDa(G148プロテインG)と58kDa(C40プロテインG)です。
  • 免疫グロブリン(immunoglobulin)
    リンク先は「抗体」です。白血球のサブタイプの一つであるリンパ球の一種であるB細胞の産生する糖タンパク分子です。抗体ともよばれ、Igと略すことが多いです。
  • 1PGA
    Protein Gの免疫グロブリン結合ドメインです。
  • アミノ酸配列(amino acid sequence)
    リンク先は「一次構造」です。一次構造は、生体分子の特定の単位とそれらをつなぐ化学結合の正確な配置のことです。タンパク質の場合は、ポリマーの分岐や交差がないため、アミノ酸残基の並びと同義です。
  • blast2seq
    アミノ酸配列用のアラインメントツールです。
  • CE
    Combinatorial extensionという立体構造比較アルゴリズムのことです。
  • E-value
    バイオインフォマティクス分野で塩基またはアミノ酸配列をクエリとしてデータベース検索を行う際に指定する類似性指標のことです。「いーばりゅー」と読み、0に近い値ほどクエリ配列とヒットした配列の類似度が高いと判断します。
  • RMSD
    リンク先は「原子位置の平均二乗偏差」です。根平均二乗変位(root mean square deviation)のことです。この業界では、RMSD(あーるえむえすでぃー、と読みます)という用語が一般的です。数値が低ければ低いほど精度がよいと判断します。最小値は0Å(オングストローム)です。
  • TM-score
    Template modeling scoreという立体構造類似性の指標の1つです。RMSDはタンパク質のサイズが大きいほど大きい値になる傾向にありますが、TM-scoreはタンパク質のサイズによらないという特徴があります。0から1の値をとり、1に近いほど類似度が高いと判断します。よく用いられる閾値は0.5以上のようです。
  • Xu and Zhang, Bioinformatics, 2010
    TM-scoreが0.5以上であればその2つの立体構造は類似していると判断する根拠となる論文です。

  • 表4.2

    立体構造比較と配列比較の結果です。表の右上の領域に立体構造比較のRMSDとTM-scoreを、左下の領域に配列相同性解析の結果とE-valueを示しています。

    Raf-1のRas結合ドメイン ユビキチン Protein Gの免疫グロブリン結合ドメイン
    Raf-1のRas結合ドメイン 2.2 Å, 0.65 2.92 Å, 0.44
    ユビキチン 有意な類似性なし 3.13 Å, 0.38
    Protein Gの免疫グロブリン結合ドメイン 有意な類似性なし 0.011

  • Raf-1
    リンク先は「RAF1」です。ヒトではRAF1遺伝子にコードされる酵素です。c-Raf (proto-oncogene c-RAF)という名称が用いられることもあり、他にもRAF proto-oncogene serine/threonine-protein kinase、Raf-1などともよばれます。c-RafはMAPK/ERK経路(ERK1/2経路)を構成し、Rasサブファミリーの下流のMAPキナーゼキナーゼキナーゼ(MAP3K)として機能します。他の多くのMAP3Kと同様、c-Rafは複数のドメインから構成されるタンパク質で、触媒活性の調節を補助する複数の付加的なドメインが存在する。N末端領域には、Ras結合ドメイン(RBD)とCキナーゼ相同ドメイン1(C1ドメイン)が隣接して存在します。
  • Ras結合ドメイン
    リンク先は「Rasタンパク質」です。Ras結合ドメインは、Rasタンパク質が結合する領域のことです。
  • 1GUA
    このタンパクのB鎖がRaf-1のRas結合ドメインです。
  • ユビキチン(ubiquitin)
    76個のアミノ酸からなるタンパク質です。他のタンパク質の修飾に用いられ、タンパク質分解、DNA修復、翻訳調節、シグナル伝達など様々な生命現象に関わっています。至る所にある(ubiquitous)ことからこの名前が付いたようです。
  • 1UBQ
    ユビキチンのPDBエントリです。
  • Protein G
    リンク先は「プロテインG」です。免疫グロブリンに結合するタンパク質で、C群およびG群のレンサ球菌によって作られます。プロテインAとよく似ていますが、特性は異なります。細胞表面にあるタンパク質で、分子量は65kDa(G148プロテインG)と58kDa(C40プロテインG)です。
  • 免疫グロブリン(immunoglobulin)
    リンク先は「抗体」です。白血球のサブタイプの一つであるリンパ球の一種であるB細胞の産生する糖タンパク分子です。抗体ともよばれ、Igと略すことが多いです。
  • 1PGA
    Protein Gの免疫グロブリン結合ドメインです。
  • 進化的類縁関係(evolutionary relationship)
    進化的な観点からみて、互いに近い関係にあることです。

  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 類縁関係
    互いに近い関係にあることです。
  • 図4.8
    タンパク質の類縁関係を階層的に分類した結果です。1NDOはA鎖のみ、1GUAはB鎖のみを比較しています。
  • 進化的類縁関係(evolutionary relationship)
    進化的な観点からみて、互いに近い関係にあることです。
  • タンパク質ファミリー(protein family)
    進化上の共通祖先に由来すると推定されるタンパク質をまとめたグループです。生物を進化系統により分類するように、タンパク質を進化の観点から分類する意味があります。同様の概念で遺伝子をまとめた「遺伝子ファミリー」(遺伝子族)もありますが、これもタンパク質ファミリーにほぼ対応します。「サブファミリー(subfamily)」や「スーパーファミリー(superfamily)」もこのリンク先になります。
    • ファミリー:配列類似性に基づいて明らかに進化的類縁関係にあるタンパク質が属する階層のことです。
    • スーパーファミリー:立体構造類似性などに基づいて、進化的類縁関係が推定されるタンパク質が属する階層のことです。
  • 1WW9
    カルバゾール1,9aジオキシゲナーゼの末端酸化酵素のPDBエントリです。
  • 1NDO
    ナフタレン1,2ジオキシゲナーゼのPDBエントリです。
  • blast2seq
    アミノ酸配列用のアラインメントツールです。
  • TM-score
    Template modeling scoreという立体構造類似性の指標の1つです。RMSDはタンパク質のサイズが大きいほど大きい値になる傾向にありますが、TM-scoreはタンパク質のサイズによらないという特徴があります。0から1の値をとり、1に近いほど類似度が高いと判断します。よく用いられる閾値は0.5以上のようです。
  • Raf-1
    リンク先は「RAF1」です。ヒトではRAF1遺伝子にコードされる酵素です。c-Raf (proto-oncogene c-RAF)という名称が用いられることもあり、他にもRAF proto-oncogene serine/threonine-protein kinase、Raf-1などともよばれます。c-RafはMAPK/ERK経路(ERK1/2経路)を構成し、Rasサブファミリーの下流のMAPキナーゼキナーゼキナーゼ(MAP3K)として機能します。他の多くのMAP3Kと同様、c-Rafは複数のドメインから構成されるタンパク質で、触媒活性の調節を補助する複数の付加的なドメインが存在する。N末端領域には、Ras結合ドメイン(RBD)とCキナーゼ相同ドメイン1(C1ドメイン)が隣接して存在します。
  • Ras結合ドメイン
    リンク先は「Rasタンパク質」です。Ras結合ドメインは、Rasタンパク質が結合する領域のことです。
  • 1GUA
    このタンパクのB鎖がRaf-1のRas結合ドメインです。
  • ユビキチン(ubiquitin)
    76個のアミノ酸からなるタンパク質です。他のタンパク質の修飾に用いられ、タンパク質分解、DNA修復、翻訳調節、シグナル伝達など様々な生命現象に関わっています。至る所にある(ubiquitous)ことからこの名前が付いたようです。
  • 1UBQ
    ユビキチンのPDBエントリです。
  • Protein G
    リンク先は「プロテインG」です。免疫グロブリンに結合するタンパク質で、C群およびG群のレンサ球菌によって作られます。プロテインAとよく似ていますが、特性は異なります。細胞表面にあるタンパク質で、分子量は65kDa(G148プロテインG)と58kDa(C40プロテインG)です。
  • 免疫グロブリン(immunoglobulin)
    リンク先は「抗体」です。白血球のサブタイプの一つであるリンパ球の一種であるB細胞の産生する糖タンパク分子です。抗体ともよばれ、Igと略すことが多いです。
  • αヘリックス(alpha helix)
    タンパク質の二次構造の共通モチーフの1つで、ばねに似た右巻きらせんの形をしています。骨格となるアミノ酸のすべてのアミノ基は、4残基離れたカルボキシ基と水素結合を形成しています。
  • βストランド(beta strand)
    リンク先は「βシート」です。βストランドは、一般的に3~10アミノ酸長のポリペプチド鎖の区間であり、骨格は伸長したコンフォメーション(立体配座)になっています。タンパク質の二次構造の共通モチーフの1つです。ちなみに、βシートは、βストランドがいくつか横方向に結合して構成されたもののことです。
page123
  • 図4.8
    タンパク質の類縁関係を階層的に分類した結果です。1NDOはA鎖のみ、1GUAはB鎖のみを比較しています。

  • フォールド(fold)
    タンパク質の折りたたみ構造のことです。図4.8でも示されていますが、ファミリーやスーパーファミリーほど似てはいないものの、αヘリックスやβストランドの配置やつながり方といった部分としては似ているところがあります。それを表す階層がフォールドです。

  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • SCOPAndreeva et al., Nucleic Acids Res., 2020
    タンパク質ドメインの立体構造を、2次構造のみに基づく分類であるクラス(class)からスタートして、フォールド(fold)、スーパーファミリー(superfamily)、ファミリー(family)の順に階層的に分類したデータベース(DB)です。SCOPは、Structural Classification of Proteinsの略です。人手による分類と計算機による自動分類法を組み合わせているのが特徴です。
  • CATHSillitoe et al., Nucleic Acids Res., 2021
    タンパク質ドメインの立体構造を、クラス(class)、アーキテクチャ(architecture)、トポロジー(topology)、ホモロガススーパーファミリー(homologous superfamily)の順に分類しています。計算機による自動分類を行っています。CATHはこれらの頭文字をとったものです。
  • ドメイン(domain)
    リンク先は「タンパク質ドメイン」です。タンパク質の配列、構造の一部で他の部分とは独立に進化し、機能を持った存在です。それぞれのドメインはコンパクトな三次元構造を作り、独立に折りたたまれ、安定化されることが多いです。多くのタンパク質がいくつかのドメインより成り立ち、1つのドメインは進化的に関連した多くのタンパク質の中に現れます。ドメインの長さは様々で、25残基程度から500残基以上に及ぶものもあります。有名なジンクフィンガーのような最も短いドメインは、金属イオンやジスルフィド結合によって安定化されます。

  • RCSB PDB
    本章で主に用いている立体構造データベースです。
  • SCOPAndreeva et al., Nucleic Acids Res., 2020
    タンパク質ドメインの立体構造を、2次構造のみに基づく分類であるクラス(class)からスタートして、フォールド(fold)、スーパーファミリー(superfamily)、ファミリー(family)の順に階層的に分類したデータベース(DB)です。SCOPは、Structural Classification of Proteinsの略です。人手による分類と計算機による自動分類法を組み合わせているのが特徴です。
  • CATHSillitoe et al., Nucleic Acids Res., 2021
    タンパク質ドメインの立体構造を、クラス(class)、アーキテクチャ(architecture)、トポロジー(topology)、ホモロガススーパーファミリー(homologous superfamily)の順に分類しています。計算機による自動分類を行っています。CATHはこれらの頭文字をとったものです。
  • Raf-1
    リンク先は「RAF1」です。ヒトではRAF1遺伝子にコードされる酵素です。c-Raf (proto-oncogene c-RAF)という名称が用いられることもあり、他にもRAF proto-oncogene serine/threonine-protein kinase、Raf-1などともよばれます。c-RafはMAPK/ERK経路(ERK1/2経路)を構成し、Rasサブファミリーの下流のMAPキナーゼキナーゼキナーゼ(MAP3K)として機能します。他の多くのMAP3Kと同様、c-Rafは複数のドメインから構成されるタンパク質で、触媒活性の調節を補助する複数の付加的なドメインが存在する。N末端領域には、Ras結合ドメイン(RBD)とCキナーゼ相同ドメイン1(C1ドメイン)が隣接して存在します。
  • Ras結合ドメイン
    リンク先は「Rasタンパク質」です。Ras結合ドメインは、Rasタンパク質が結合する領域のことです。
  • 1GUA
    このタンパクのB鎖がRaf-1のRas結合ドメインです。このRCSB PDBのリンク先でAnnotatoinsタブを眺めると、SCOPの分類では4階層それぞれで下記になっています:
    • クラス:Alpha and beta proteins (a+b)
    • フォールド:beta-Grasp (ubiquitin-like)
    • スーパーファミリー:Ubiquitin-like
    • ファミリー:Ras-binding domain, RBD
  • 1UBQ
    ユビキチンのPDBエントリです。このRCSB PDBのリンク先でAnnotatoinsタブを眺めると、SCOPの分類では4階層それぞれで下記になっています:
    • クラス:Alpha and beta proteins (a+b)
    • フォールド:beta-Grasp (ubiquitin-like)
    • スーパーファミリー:Ubiquitin-like
    • ファミリー:Ubiquitin-related
  • 1PGA
    Protein Gの免疫グロブリン結合ドメインです。このRCSB PDBのリンク先でAnnotatoinsタブを眺めると、SCOPの分類では4階層それぞれで下記になっています:
    • クラス:Alpha and beta proteins (a+b)
    • フォールド:beta-Grasp (ubiquitin-like)
    • スーパーファミリー:Immunoglobulin-binding domains
    • ファミリー:Immunoglobulin-binding domains
  • 図4.8
    タンパク質の類縁関係を階層的に分類した結果です。1NDOはA鎖のみ、1GUAはB鎖のみを比較しています。
  • 1GUA
    このタンパクのB鎖がRaf-1のRas結合ドメインです。このRCSB PDBのリンク先でAnnotatoinsタブを眺めると、CATHの分類では4階層それぞれで下記になっています:
    • クラス:Alpha Beta
    • アーキテクチャ:Roll
    • トポロジー:Ubiquitin-like (UB roll)
    • ホモロジー:Phosphatidylinositol 3-kinase Catalytic Subunit
  • 1UBQ
    ユビキチンのPDBエントリです。このRCSB PDBのリンク先でAnnotatoinsタブを眺めると、CATHの分類では4階層それぞれで下記になっています:
    • クラス:Alpha Beta
    • アーキテクチャ:Roll
    • トポロジー:Ubiquitin-like (UB roll)
    • ホモロジー:Phosphatidylinositol 3-kinase Catalytic Subunit
  • 1PGA
    Protein Gの免疫グロブリン結合ドメインです。このRCSB PDBのリンク先でAnnotatoinsタブを眺めると、CATHの分類では4階層それぞれで下記になっています:
    • クラス:Alpha Beta
    • アーキテクチャ:Roll
    • トポロジー:Ubiquitin-like (UB roll)
    • ホモロジー:- (空欄)
  • 相同性検索(homology search)
    リンク先は「相同性」です。あるfeature(この場合は塩基配列)が共通の祖先に由来するかどうかを調べることです。ホモロジー検索ともよばれます。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • 進化的類縁関係(evolutionary relationship)
    進化的な観点からみて、互いに近い関係にあることです。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
page124

4.8 分子力学法

  • 分子シミュレーション(molecular simulation)
    何らかの物理現象や物質が持つ物性などを分子の動きを数値計算することにより解析する試みのことです。本章では、「4.8 分子力学法」、「4.9 分子動力学法」、「4.10 立体構造予測」、「4.11 複合体構造予測」の総称として「分子シミュレーション」という言葉を用いています。根底にある概念という意味です。それゆえ、たとえば後のほうで出現する「分子動力学シミュレーション」という言葉は、「分子動力学法を用いた分子シミュレーション」という風に解釈すればよいです。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 分子力学法(molecular mechanics)
    分子の立体配座の安定性や配座間のエネルギー差を原子間に働く力によるポテンシャルエネルギーの総和によって計算する手法のことです。分子の持つエネルギーはシュレーディンガー方程式を解くことによって計算することが可能であるが、これは分子を構成する原子および電子の数が多くなると計算量が急激に増加し困難になります。しかしその一方で、分子の内部の原子どうしに働く力はその原子の種類や結合様式が同じならば、別の種類の分子でもほぼ同じです。そこで原子間に働くすべての力を、原子間の結合を表すパラメータ(結合距離、結合角など)を変数とし、原子の種類や結合様式によって決まる関数で表します。そしてそれらの力によるポテンシャルエネルギーの総和が分子の持つエネルギーとなっていると考えます。このような考えのもとに、様々な実験値をうまく説明できるような原子間のポテンシャルエネルギーを表す式を経験的に、あるいは量子化学的手法によって導き、それによって分子の立体配座の安定性や配座間のエネルギー差を計算する手法が分子力学法です。

4.8.1 ポテンシャルエネルギー関数

  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • シュレーディンガー方程式(Schrödinger equation)
    物理学の量子力学における基礎方程式です。シュレーディンガー方程式の解は一般的に波動関数とよばれます。波動関数はまた状態関数ともよばれ、量子系(電子など量子力学で取り扱う対象)の状態を表します。シュレーディンガー方程式は、ある状況の下で量子系が取り得る量子状態を決定し、また系の量子状態が時間的に変化していくかを記述します。
  • 解析的(analytic)
    方程式の解が、いろいろ式変形していけば得られるということです。
  • 原子核(atomic nucleus)
    単に核(かく、(英:nucleus)ともいい、電子と共に原子を構成している。原子の中心に位置する核子の塊であり、正の電荷を帯びています。原子核は原子と比べて非常に小さいです。
  • Born-Oppenheimer近似
    リンク先は「ボルン–オッペンハイマー近似」です。電子と原子核の運動を分離して、それぞれの運動を表す近似法です。この近似は、原子核の質量が電子の質量よりも遥かに大きいために可能となります。
  • 分子軌道法(Molecular Orbital method; MO法)
    原子に対する原子軌道の考え方を、そのまま分子に対して適用したものです。分子軌道法では、分子中の電子が原子間結合として存在しているのではなく、原子核や他の電子の影響を受けて分子全体を動きまわるとして、分子の構造を決定します。
  • W4.5

    MO法のプログラムです。Gaussian*は有料です。GAMESSは、USバージョンとUKバージョンがあります。論文のMethodsでもどちらのバージョンかまで明記されることが多いので、ここではGAMESS(US)と記載しています。

    名称 URL
    Gaussian* http://gaussian.com/
    GAMESS(US) https://www.msg.chem.iastate.edu/gamess/

  • 小分子(small molecule)
    低分子量(900ダルトン未満)の有機化合物のことで、大きさは1 nm程度です。多くの医薬薬は小分子である。核酸やタンパク質などの大きな構造物や多糖の多くは小分子ではありませんが、それらを構成するモノマー(それぞれリボヌクレオチドまたはデオキシリボヌクレオチド、アミノ酸、単糖)は小分子とみなされることが多いです。
  • MO法
    分子軌道法(Molecular Orbital method)のことです。原子に対する原子軌道の考え方を、そのまま分子に対して適用したものです。分子軌道法では、分子中の電子が原子間結合として存在しているのではなく、原子核や他の電子の影響を受けて分子全体を動きまわるとして、分子の構造を決定します。
  • 運動方程式(equation of motion)
    物理学において運動の従う法則を数式に表したものです。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 分子力学法(molecular mechanics)
    分子の立体配座の安定性や配座間のエネルギー差を原子間に働く力によるポテンシャルエネルギーの総和によって計算する手法のことです。分子の持つエネルギーはシュレーディンガー方程式を解くことによって計算することが可能であるが、これは分子を構成する原子および電子の数が多くなると計算量が急激に増加し困難になります。しかしその一方で、分子の内部の原子どうしに働く力はその原子の種類や結合様式が同じならば、別の種類の分子でもほぼ同じです。そこで原子間に働くすべての力を、原子間の結合を表すパラメータ(結合距離、結合角など)を変数とし、原子の種類や結合様式によって決まる関数で表します。そしてそれらの力によるポテンシャルエネルギーの総和が分子の持つエネルギーとなっていると考えます。このような考えのもとに、様々な実験値をうまく説明できるような原子間のポテンシャルエネルギーを表す式を経験的に、あるいは量子化学的手法によって導き、それによって分子の立体配座の安定性や配座間のエネルギー差を計算する手法が分子力学法です。
  • 典型的なポテンシャルエネルギー関数の例です。
    \[ \begin{align} E(\boldsymbol{\rm r}) &= \sum_b k_b (r_b - r_b^0)^2 + \sum_a k_a (\theta_a - \theta_a^0)^2 + \sum_d k_d [1 + \cos (n_d \phi_d - \delta_d^0)] \\ & + \sum_{i, j} \biggl\{ 4 \varepsilon_{ij} \biggl[\Bigl(\frac{\sigma_{ij}}{r_{ij}}\Bigr)^{12} - \Bigl(\frac{\sigma_{ij}}{r_{ij}}\Bigr)^6\biggr] \biggr\} + \sum_{i, j} \frac{q_i q_j e^2 N_{\rm A}}{4 \pi \varepsilon_0 r_{ij}} \end{align} \] 以下は記号の説明です:
    • \(k_b\)
      力の定数です。
    • \(r_b\)
      \(b\)番目の共有結合の長さです。
    • \(r_b^0\)
      平衡結合長です。
    • \(k_a\)
      力の定数です。
    • \(\theta_a\)
      \(a\)番目の共有結合角です。
    • \(\theta_a^0\)
      \(a\)番目の平衡結合角です。
    • \(k_d\)
      エネルギー極小状態の間の障壁の高さです。
    • \(n_d\)
      エネルギー極小状態の数です。
    • \(\phi_d\)
      \(d\)番目の二面角です。
    • \(\delta_d^0\)
      エネルギー極小状態の位相を決める定数です。
    • \(\varepsilon_{ij}\)
      \(i\)番目と\(j\)番目の原子の間のwell depthです。適当な日本語訳が見当たりませんが、page125でも書いているように、\(\varepsilon\)はエネルギー最小状態の深さを決めるパラメータです。
    • \(\sigma_{ij}\)
      \(i\)番目と\(j\)番目の原子の間の衝突半径です。
    • \(r_{ij}\)
      \(i\)番目と\(j\)番目の原子の間の距離を表しており、分子の座標\(\boldsymbol{\rm r}\)から計算されます。
    • \(q_i q_j e^2\)
      \(q_i e\)\(q_j e\)という風に分けて考えます。\(q_i e\)\(i\)番目の原子の位置にある点電荷、\(q_j e\)\(j\)番目の原子の位置にある点電荷です。
    • \(e\)
      電気素量です。
    • \(N_{\rm A}\)
      アボガドロ定数です。
    • \(\pi\)
      円周率(円の直径に対する円周の長さの比率)のことです。
    • \(\varepsilon_0\)
      真空の誘電率です。

  • 共有結合長(covalent bond length)
    リンク先は「結合長」です。共有結合している2つの原子間の平均距離のことです。上記ポテンシャルエネルギー関数例の第1項\(\sum_b k_b (r_b - r_b^0)^2\)のことです。
  • 共有結合角(covalent bond angle)
    リンク先は「結合角」です。分子構造の構造要素の1つで、それぞれの原子から伸びている2つの共有結合のなす角度のことです。上記ポテンシャルエネルギー関数例の第2項\(\sum_a k_a (\theta_a - \theta_a^0)^2\)のことです。
  • 二面角(dihedral angle)
    2つの平面(またはその部分集合)がなす角度である。たとえば、二面角が0なら2面は平行(同一の場合を含む)で、\(\pi/2\) (つまり90度)なら垂直です。上記ポテンシャルエネルギー関数例の第3項\(\sum_d k_d [1 + \cos (n_d \phi_d - \delta_d^0)]\)のことです。
  • van der Waals相互作用
    リンク先は「ファンデルワールス力」です。原子、イオン、分子の間に働く力(分子間力)の一種です。ファンデルワールス力によって分子間に形成される結合を、ファンデルワールス結合といいます。van der Waals力は、ヨハネス・ファン・デル・ワールスが実在気体の状態方程式を定式化した際に導入された凝縮力です。van der Waals相互作用は、これまでの説明部分で「力」を「相互作用」に置き換えたものだと解釈すればよいです。上記ポテンシャルエネルギー関数例の第4項\(\sum_{i, j} \biggl\{ 4 \varepsilon_{ij} \biggl[\Bigl(\frac{\sigma_{ij}}{r_{ij}}\Bigr)^{12} - \Bigl(\frac{\sigma_{ij}}{r_{ij}}\Bigr)^6\biggr] \biggr\}\)のことです。
  • 静電相互作用(electrostatic interaction)
    リンク先は「分子間力」です。分子どうしや高分子内の離れた部分の間に働く電磁気学的な力(相互作用)のことです。上記ポテンシャルエネルギー関数例の第5項\(\sum_{i, j} \frac{q_i q_j e^2 N_{\rm A}}{4 \pi \varepsilon_0 r_{ij}}\)のことです。
  • 真空の誘電率(permittivity of vacuum)
    リンク先は「電気定数」です。電気的な場を関係づける構成方程式の係数として表される物理定数です。電気定数(electric constant)ともよばれます。
  • 電気素量(elementary charge)
    電気量の単位となる物理定数です。陽子あるいは陽電子1個の電荷に等しく、電子の電荷の符号を変えた量に等しいです。。素電荷(そでんか)、電荷素量ともよばれます。
  • アボガドロ定数(Avogadro constant)
    物質量1 molを構成する粒子(分子、原子、イオンなど)の個数を示す定数です。
  • 共有結合(covalent bond)
    原子間での電子対の共有をともなう化学結合のことです。結合は非常に強く、ほとんどの分子は共有結合によって形成されます。
  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • トポロジー(topology)
    この場合は、どの原子がどの原子と共有結合相互作用を形成しているかという情報のことです。
  • 周期関数(periodic function)
    一定の間隔あるいは周期ごとに取る値が繰り返す関数のことです。代表的な例としては、sinなどの三角関数があげられます。

  • van der Waals相互作用
    リンク先は「ファンデルワールス力」です。原子、イオン、分子の間に働く力(分子間力)の一種です。ファンデルワールス力によって分子間に形成される結合を、ファンデルワールス結合といいます。van der Waals力は、ヨハネス・ファン・デル・ワールスが実在気体の状態方程式を定式化した際に導入された凝縮力です。van der Waals相互作用は、これまでの説明部分で「力」を「相互作用」に置き換えたものだと解釈すればよいです。
  • Lennard-Jonesポテンシャル(Lennard-Jones potential)
    リンク先は「レナード-ジョーンズ・ポテンシャル」です。2つの原子間の相互作用ポテンシャルエネルギーを表す経験的なモデルの1つです。ポテンシャル曲線を表す式が簡単で扱いやすいので、分子動力学計算など、様々な分野において使われます。

page125
  • 図4.9
    Lennard-Jonesポテンシャルの概形です。\(\sigma\) = 3、\(\varepsilon\) = 1としています。
  • 図4.10
    van der Waals引力の起源のイメージです。

  • Lennard-Jonesポテンシャルの一般形です。図4.9の横軸が\(r\)、縦軸が\(E_{\rm{LJ}} (r)\)であることからも納得できると思いますが、\(E_{\rm{LJ}} (r)\)は2つの粒子間の距離\(r\)によって定まります。左辺の添え字としてつけられている\(\rm{LJ}\)はLennard-Jonesのことです。
    \[ E_{\rm{LJ}} (r) = 4 \varepsilon \biggl[\Bigl(\frac{\sigma}{r}\Bigr)^{12} - \Bigl(\frac{\sigma}{r}\Bigr)^6\biggr] \]
  • 斥力(repulsion)
    リンク先は「引力と斥力」です。斥力(repulsion)または反発力とは、同様に2つの物体の間に働く相互作用であるが、反発し合う、すなわち互いを遠ざけようとする力のことです。
  • 引力(attraction)
    リンク先は「引力と斥力」です。引力(attraction)は、2つの物体の間に働く相互作用のうち、引き合う(互いを近付けようとする)力のことです。
  • 衝突直径(collision diameter)
    2つの分子が衝突したときの2つの分子の中心間距離のことです。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。分子どうしの間の相互作用は分子間相互作用ですし、イオンどうしの相互作用はイオン間相互作用です。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 電荷(electric charge)
    粒子や物体が帯びている電気の量であり、また電磁場から受ける作用の大きさを規定する物理量です。 荷電ともよばれます。
  • 電気双極子(electric dipole)
    大きさの等しい正負の電荷が無限小の間隔で対となって存在する状態のことです。
  • メタン(methane)
    最も単純な構造のアルカンで、1個の炭素原子に4個の水素原子が結合してできた炭化水素です。分子式は CH4です。
  • 図4.10
    van der Waals引力の起源のイメージです。

  • 点電荷(point charge)
    電荷だけあって、大きさのない点状の物体のことです。正や負の電気を帯びた素粒子という理解でもよいです。
  • クーロンポテンシャル(Coulomb potential)
    リンク先は「クーロンの法則」です。クーロンの法則によって生じた力による位置エネルギーのことです。クーロンの法則とは、荷電粒子間に働く反発し、または引き合う力がそれぞれの電荷の積に比例し、距離の2乗に反比例すること(逆2乗の法則)を示した電磁気学の基本法則のことです。ややこしいので、クーロンポテンシャルとは「電気的な力によって生じる位置エネルギー」という理解でもよいです。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • アボガドロ定数(Avogadro constant)
    物質量1 molを構成する粒子(分子、原子、イオンなど)の個数を示す定数です。
  • 単原子イオン(monatomic ion)
    1種類の元素の1つまたはそれ以上の数の原子で構成されるイオンのことです。

4.8.2 力場パラメータの決定

  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • 分子軌道法(Molecular Orbital method; MO法)
    原子に対する原子軌道の考え方を、そのまま分子に対して適用したものです。分子軌道法では、分子中の電子が原子間結合として存在しているのではなく、原子核や他の電子の影響を受けて分子全体を動きまわるとして、分子の構造を決定します。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 非経験的パラメータ(ab initio parameters)
    分子の構造を様々に変化させたときのエネルギーの値を、MO法を用いて計算し、ポテンシャルエネルギー関数がこれを再現するように調整することで決定したパラメータのことです。
  • 経験的パラメータ(empirical parameter)
    構造や熱力学量などの実験値を再現するように決定されたパラメータのことです。

  • 水素分子( hydrogen molecule)
    常温常圧では無色無臭の気体として存在する、分子式 H2で表される単体です。
  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • 水素原子(hydrogen atom)
    水素の原子であり、1つの陽子と1つの電子により構成されています。水素原子は宇宙の全質量の約75%を占めます。
page126
  • 図4.11
    MO法によって計算した水素分子のポテンシャルエネルギーです。

  • MO法
    分子軌道法(Molecular Orbital method)のことです。原子に対する原子軌道の考え方を、そのまま分子に対して適用したものです。分子軌道法では、分子中の電子が原子間結合として存在しているのではなく、原子核や他の電子の影響を受けて分子全体を動きまわるとして、分子の構造を決定します。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 気体定数(gas constant)
    理想気体の状態方程式における定数として導入される物理定数です。理想気体だけでなく、実在気体や液体における量を表すときにも用いられます。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • テーラー展開(Taylor expansion)
    リンク先は「テイラー展開」です。関数のある一点での導関数の値から計算される項の無限和として関数を表したものをテイラー級数といい、そのような級数を得ることをテイラー展開といいます。
  • ポテンシャルエネルギー関数\(E(r)\)\(r_0\)の周りでテーラー展開した式
    \[ E(r_0 + \Delta r) = E(r_0) + \left.\frac{\partial E(r)}{\partial r}\right|_{r_0} \Delta r + \left.\frac{1}{2} \frac{\partial^2 E(r)}{\partial r^2}\right|_{r_0} \Delta r^2 + O(\Delta r^3) \]
  • 上式の右辺第2項がゼロ、\(\Delta r^3\)に比例する項を無視すると、以下のようになります。
    \[ E(r_0 + \Delta r) - E(r_0) \approx \left.\frac{1}{2} \frac{\partial^2 E(r)}{\partial r^2}\right|_{r_0} \Delta r^2 = k (r - r_0)^2 \]
  • 分子力学法(molecular mechanics)
    分子の立体配座の安定性や配座間のエネルギー差を原子間に働く力によるポテンシャルエネルギーの総和によって計算する手法のことです。分子の持つエネルギーはシュレーディンガー方程式を解くことによって計算することが可能であるが、これは分子を構成する原子および電子の数が多くなると計算量が急激に増加し困難になります。しかしその一方で、分子の内部の原子どうしに働く力はその原子の種類や結合様式が同じならば、別の種類の分子でもほぼ同じです。そこで原子間に働くすべての力を、原子間の結合を表すパラメータ(結合距離、結合角など)を変数とし、原子の種類や結合様式によって決まる関数で表します。そしてそれらの力によるポテンシャルエネルギーの総和が分子の持つエネルギーとなっていると考えます。このような考えのもとに、様々な実験値をうまく説明できるような原子間のポテンシャルエネルギーを表す式を経験的に、あるいは量子化学的手法によって導き、それによって分子の立体配座の安定性や配座間のエネルギー差を計算する手法が分子力学法です。
  • 水分子のポテンシャルエネルギー関数の式
    エネルギーが最小となる結合長\(r_0 = 0.7274\) Å(オングストローム)という値は、このページの上から3行目あたりで言及されています。
    \[ E(r) = k (r - r_0)^2 = 948.6 \times (r - 0.7274)^2 \]
  • MO法
    分子軌道法(Molecular Orbital method)のことです。原子に対する原子軌道の考え方を、そのまま分子に対して適用したものです。分子軌道法では、分子中の電子が原子間結合として存在しているのではなく、原子核や他の電子の影響を受けて分子全体を動きまわるとして、分子の構造を決定します。
  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 水分子(water molecule)
    リンク先は「水」です。化学式 H2Oで表される、水素と酸素の化合物です。
  • 水素結合(hydrogen bond)
    電気陰性度が大きな原子(陰性原子)に共有結合で結びついた水素原子が、近傍に位置した窒素、酸素、硫黄、フッ素、π電子系などの孤立電子対とつくる非共有結合性の引力的相互作用です。水素結合には、異なる分子の間に働くもの(分子間力)と単一の分子の異なる部位の間(分子内)に働くものがあります。
  • 密度(density)
    単位体積あたりの質量のことです。
page127
  • 表4.3

    水分子の力場パラメータです。r(OH):水素原子と酸素原子の共有結合長。∠HOH:2つの水素原子と酸素原子の共有結合がなす角。r’:水分子の間のLennard-Jonesポテンシャルのパラメータσを用いて\(r' = \frac{\sqrt[6]{2}σ}{2}\)と表されます。酸素原子間の距離を相互作用距離とします。ε:水分子の間のLennard-Jonesポテンシャルのパラメータ。qH:水素原子の電荷。

    SPC TIP3P
    r(OH) [Å] 1.0 0.9572
    ∠HOH [degree] 109.47 104.52
    r’ [Å] 1.7766 1.7682
    ε [kcal mol−1] 0.1554 0.1520
    qH 0.41 0.417

  • 表4.4

    水分子のモデルを用いた熱力学量の計算値と実験値の比較です。

    SPC TIP3P 実験値
    密度 [g cm−3] 0.971 0.982 0.997
    蒸発熱 [kcal mol−1] 10.77 10.45 10.51
    定圧比熱 [cal mol−1 K−1] 23.4 16.8 17.99
    膨張率 [10-5 K-1] 58 41 25.7
    圧縮率 [10-6 atm] 27 18 45.8

  • Jorgensen et al., J Chem Phys., 1983

4.8.3 生体高分子の力場パラメータ

  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • MO法
    分子軌道法(Molecular Orbital method)のことです。原子に対する原子軌道の考え方を、そのまま分子に対して適用したものです。分子軌道法では、分子中の電子が原子間結合として存在しているのではなく、原子核や他の電子の影響を受けて分子全体を動きまわるとして、分子の構造を決定します。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • アミノ酸(amino acid)
    広義には、アミノ基とカルボキシ基の両方の官能基を持つ有機化合物の総称です。狭義には、生体のタンパク質の構成ユニットとなる「α-アミノ酸」のことを指します。α-アミノ酸は、カルボキシ基が結合している炭素(α炭素)にアミノ基も結合しているアミノ酸であり、RCH(NH2)COOH という構造をもちます。このうちRに相当する部分は側鎖とよばれます。
  • 主鎖構造
    C\(\alpha\)原子座標に基づく構造のことです。C\(\alpha\)原子はアミノ酸のカルボキシル基に最も近い炭素原子を表し、通常は主鎖の一部であると考えられていることを根拠としています。
  • 側鎖(side chain)
    主鎖(またはバックボーン)とよばれる分子の中心部分に結合している化学基(置換基)のことです。α-アミノ酸のRCH(NH2)COOH という構造のうち、Rに相当する部分が側鎖です。タンパク質の性質は側鎖によって決まります。
  • 炭化水素(hydrocarbon)
    炭素原子と水素原子だけでできた化合物の総称です。
  • ベンゼン環(benzene ring)
    リンク先は「ベンゼン」です。分子式 C6H6、分子量 78.11 の最も単純な芳香族炭化水素である。原油に含まれており、石油化学における基礎的化合物の1つです。6個の炭素原子が平面上に亀の甲(六角形)状に配置し、各炭素はsp2混成軌道をとっているのでベンゼン環とよばれます。したがって、ベンゼンとベンゼン環は実質的に同じものを指します。
  • 水酸基(hydroxy group)
    リンク先は「ヒドロキシ基」です。有機化学において構造式が「−OH」と表される1価の官能基です。
  • 置換基
    リンク先は「基」です。化合物の系統あるいは命名を考える際の部分構造であり、母体化合物(あるいは母核、親化合物)と対になって使用される概念です。化合物の系統を単純な構造の化合物から複雑な構造の化合物へと系統づけるため、共通する構造を母体と呼び、相異なる部分を置換基とよびます。母体化合物が単独で存在するときにはひとつの原子(実際には水素)で占められている箇所を、置換基が置き換えたと考えます。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。分子どうしの間の相互作用は分子間相互作用ですし、イオンどうしの相互作用はイオン間相互作用です。
  • 混成軌道(hybrid orbital)
    原子が化学結合を形成する際に、新たに作られる原子軌道のことです。
  • 原子種
    ここでは、「混成軌道の種類や、置換基の種類など、類似した化学的環境にある原子」をひとまとめにして取り扱うべく、「原子種」という言葉でグルーピングしています。
  • 低分子化合物(small molecule compound)
    分子量の小さい化合物のことです。分子量が1万以下のものを指すことが多いようです。
  • 図4.12
    アミノ酸への原子種の割り当ての例(左)と、力場パラメータの決定のために用いられるモデル化合物の例(右)です。
  • 電荷(electric charge)
    粒子や物体が帯びている電気の量であり、また電磁場から受ける作用の大きさを規定する物理量です。 荷電ともよばれます。
  • 共有結合(covalent bond)
    原子間での電子対の共有をともなう化学結合のことです。結合は非常に強く、ほとんどの分子は共有結合によって形成されます。
  • van der Waals相互作用
    リンク先は「ファンデルワールス力」です。原子、イオン、分子の間に働く力(分子間力)の一種です。ファンデルワールス力によって分子間に形成される結合を、ファンデルワールス結合といいます。van der Waals力は、ヨハネス・ファン・デル・ワールスが実在気体の状態方程式を定式化した際に導入された凝縮力です。van der Waals相互作用は、これまでの説明部分で「力」を「相互作用」に置き換えたものだと解釈すればよいです。
  • ヌクレオチド(nucleotide)
    ヌクレオドは、ヌクレオシド(塩基と糖が結合した化合物の一種)にリン酸基が結合したものです。ヌクレオドの糖として、リボースが結合したものがリボヌクレオド、デオキシリボースが結合したものがデオキシリボヌクレオドです。リボヌクレオドにリン酸基が結合したものがリボヌクレオド、デオキシリボヌクレオドにリン酸基が結合したものがデオキシリボヌクレオドです。
  • 塩基(base)
    リンク先は「核酸塩基」です。ヌクレオドを形成する窒素含有生体分子で、窒素塩基としても知られています。多くの場合、単に塩基(base)とよばれます。ヌクレオドはヌクレオドの構成要素であり、ヌクレオドは核酸の基本的な構成単位です。塩基対を形成し、互いに積み重なる(スタッキング)核酸塩基の性質は、リボ核酸(RNA)やデオキシリボ核酸(DNA)などの長鎖らせん構造をもたらします。DNAを構成する塩基は、プリン塩基であるアデニン(A)とグアニン(G)、ピリミジン塩基であるシトシン(C)とチミン(T)の4種類があります。
  • リボース(ribose)
    単糖の1種で、炭素鎖の長さが5つのアルドースのことです。リボースは地球生物に普遍的に見られる糖であり、核酸塩基と結合してヌクレオシドを形作っており、リボ核酸の構成糖として知られています。リボースは地球生物の体内では、グルコースを原料に合成されます。
  • リン酸(phosphoric acid)
    リンのオキソ酸の一種で、化学式H3PO4の無機酸です。オルトリン酸(orthophosphoric acid)ともよばれます。広義では、オルトリン酸・二リン酸(ピロリン酸)H4P2O7・メタリン酸HPO3など、五酸化二リンP2O5が水和してできる酸を総称してリン酸ということがあります。

page128
  • 図4.12
    アミノ酸への原子種の割り当ての例(左)と、力場パラメータの決定のために用いられるモデル化合物の例(右)です。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 分子シミュレーション(molecular simulation)
    何らかの物理現象や物質が持つ物性などを分子の動きを数値計算することにより解析する試みのことです。本章では、「4.8 分子力学法」、「4.9 分子動力学法」、「4.10 立体構造予測」、「4.11 複合体構造予測」の総称として「分子シミュレーション」という言葉を用いています。根底にある概念という意味です。それゆえ、たとえば後のほうで出現する「分子動力学シミュレーション」という言葉は、「分子動力学法を用いた分子シミュレーション」という風に解釈すればよいです。
  • W4.6

    分子動力学シミュレーションに有用なサイトです。*1シミュレーションプログラムは一部有料です。*2学術利用は、シミュレーションプログラムの一部を除き無料です。商用利用は別ライセンスで有料です。*3商用利用は有料です。*4学術利用は無料です。商用利用は別ライセンスです。*5学術利用は無料です。商用利用は別ライセンスです。

    URL 内容
    http://ambermd.org/ Amber力場、Amber力場用セットアップ・シミュレーション・解析プログラム*1
    http://amber.manchester.ac.uk/ Amber parameter database
    http://mackerell.umaryland.edu/charmm_ff.shtml CAHRMM力場
    https://academiccharmm.org/ CHARMM力場用セットアップ・シミュレーション・解析プログラム*2
    https://charmm-gui.org/ CHARMM力場用セットアップWebサーバ*3
    https://www.ks.uiuc.edu/Research/namd/ シミュレーションプログラム(NAMD)*4
    https://www.ks.uiuc.edu/Research/vmd/ CHARMM力場用セットアップ・解析プログラム、トラジェクトリ可視化プログラム(VMD)*5
    http://www.gromacs.org/ シミュレーション・解析プログラム(GROMACS)
    https://www.r-ccs.riken.jp/labs/cbrt/ シミュレーション・解析プログラム(GENESIS)
    https://opm.phar.umich.edu/ OPMデータベース

  • アミノ酸(amino acid)
    広義には、アミノ基とカルボキシ基の両方の官能基を持つ有機化合物の総称です。狭義には、生体のタンパク質の構成ユニットとなる「α-アミノ酸」のことを指します。α-アミノ酸は、カルボキシ基が結合している炭素(α炭素)にアミノ基も結合しているアミノ酸であり、RCH(NH2)COOH という構造をもちます。このうちRに相当する部分は側鎖とよばれます。
  • ヌクレオチド(nucleotide)
    ヌクレオドは、ヌクレオシド(塩基と糖が結合した化合物の一種)にリン酸基が結合したものです。ヌクレオドの糖として、リボースが結合したものがリボヌクレオド、デオキシリボースが結合したものがデオキシリボヌクレオドです。リボヌクレオドにリン酸基が結合したものがリボヌクレオド、デオキシリボヌクレオドにリン酸基が結合したものがデオキシリボヌクレオドです。
  • 糖(sugar)
    多価アルコールの最初の酸化生成物であり、ホルミル基(−CHO)またはカルボニル基(>C=O)を1つもちます。
  • 脂質(lipid)
    リンク先は「脂肪」です。炭水化物、タンパク質と共に「三大栄養素」と総称され、多くの生物種の栄養素です。脂肪のカロリーは9kcal/gであり、炭水化物、タンパク質の4kcal/gよりも単位重量あたりの熱量が大きく、哺乳類をはじめとして動物の栄養の摂取や貯蔵方法として多く利用されています。
  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • 阻害剤(inhibitor)
    リンク先は「酵素阻害剤」です。酵素などの分子に結合してその活性を低下または消失させる物質のことです。
  • 薬剤(drug)
    リンク先は「薬物」です。生物が摂取することでその生理や心理に変化をもたらす物質のことです。薬理学の分野では、生体に投与されると生物学的な効果をもたらす化学物質を指し、一般にその構造はわかっています。
  • 低分子化合物(small molecule compound)
    分子量の小さい化合物のことです。分子量が1万以下のものを指すことが多いようです。
  • general Amber force field(GAFF)
    Amber力場で、低分子化合物の力場パラメータを生成する際に用いるプログラム。
  • CHARMM general force field(CGenFF)
    CHARMM力場で、低分子化合物の力場パラメータを生成する際に用いるプログラム。

4.8.4 エネルギー最小化

  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 座標(coordinates)
    点の位置を指定するために与えられる数の組(coordinates)、あるいはその各数(coordinate)のことです。
  • 偏微分(partial derivative)
    多変数関数に対して1つの変数のみに関する微分のことです。
  • 原子\(i\)に働く力\(\boldsymbol{\rm F}_i\)の式
    \[ \boldsymbol{\rm F}_i = - \frac{\partial E(\boldsymbol{\rm r})}{\partial \boldsymbol{\rm r_i}} \]
  • エネルギー最小化(energy minimization)
    リンク先は「Energy minimization」です。とりうる様々なコンフォメーションの中から、エネルギーが最小の立体構造を得る作業のことです。構造最適化ともよばれます。エネルギー最小化計算では、原子どうしのぶつかりの排除や、局所的な歪みの補正が行われます。

  • エネルギー最小化(energy minimization)
    リンク先は「Energy minimization」です。とりうる様々なコンフォメーションの中から、エネルギーが最小の立体構造を得る作業のことです。構造最適化ともよばれます。エネルギー最小化計算では、原子どうしのぶつかりの排除や、局所的な歪みの補正が行われます。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 最急降下法(steepest descent method)
    関数(ポテンシャル面)の傾き(一階微分)のみから、関数の最小値を探索する連続最適化問題の勾配法のアルゴリズムの1つです。
  • 共役勾配法(conjugate gradient method)
    対称正定値行列を係数とする連立一次方程式を解くためのアルゴリズムです。反復法として利用され、コレスキー分解のような直接法では大きすぎて取り扱えない、大規模な疎行列を解くために利用されます。エネルギー最小化などの最適化問題を解くために用いることもできます。
  • Newton-Raphson法
    リンク先は「ニュートン法」です。方程式系を数値計算によって解くための反復法による求根アルゴリズムの1つです。
  • ヘッセ行列(Hessian matrix)
    多変数スカラー値関数の二階偏導関数全体が作る正方行列です。実数値関数の極値判定に用いられます。Hessianともよばれます。

page129
  • 例題4.2
    1ページ目が問題、2ページ目以降が解答例です。
    • 抗インフルエンザ薬oseltamivir
      リンク先は「オセルタミビル」です。オセルタミビル(oseltamivir)は、インフルエンザウイルスに効く抗ウイルス薬です。オセルタミビルリン酸塩として、スイスのロシュ社により商品名「タミフル」(tamiflu、登録商標第4376708号ほか)で販売されています。
    • 立体構造(tertiary structure)
      リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
    • PubChemSayers et al., Nucleic Acids Res., 2021
      化学分子データベースの1つです。
  • エネルギー最小化(energy minimization)
    リンク先は「Energy minimization」です。とりうる様々なコンフォメーションの中から、エネルギーが最小の立体構造を得る作業のことです。構造最適化ともよばれます。エネルギー最小化計算では、原子どうしのぶつかりの排除や、局所的な歪みの補正が行われます。

4.9 分子動力学法

  • 分子動力学法(molecular dynamics; MD)
    原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
  • ニュートンの運動方程式(Newton’s equation of motion)
    古典力学において、物体の非相対論的な運動を記述する微分方程式です。

4.9.1 運動方程式の数値解法

  • ニュートンの運動方程式(Newton’s equation of motion)
    古典力学において、物体の非相対論的な運動を記述する微分方程式です。
  • 4.9.1項の最初の文にについて
    初刷では「…原子\(i\)の加速度\(\boldsymbol{\rm a}_i\)は…」となっていましたが、正しくは「原子\(i\)の加速度\(\boldsymbol{\rm a}_i\)は」ですm(_ _)m。「を」を消し忘れていたということです。
  • 加速度(acceleration)
    単位時間当たりの速度の変化率(速度の時間微分)です。速度ベクトルの時間的な変化を示すベクトルとして、加速度が定義されます。
  • 原子\(i\)の加速度\(\boldsymbol{\rm a}_i\)は、この原子に働く力\(\boldsymbol{\rm F}_i\)と質量\(m_i\)を用いて以下の式で与えられます。
    \[ m_i \boldsymbol{\rm a}_i = \boldsymbol{\rm F}_i \]
  • ニュートンの運動方程式(Newton’s equation of motion)
    古典力学において、物体の非相対論的な運動を記述する微分方程式です。
  • 解析的(analytic)
    方程式の解が、いろいろ式変形していけば得られるということです。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 分子動力学法(molecular dynamics; MD)
    原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
  • 速度ベルレ法(velocity Verlet method)
    リンク先は「ベレの方法」です。分子動力学法などにおいて、原子間(粒子間)に働く力をもとに原子(粒子)を逐次的に動かす方法の1つです。ベレのアルゴリズム、ベレ法、ベルレの方法などともよばれます。
  • 蛙飛び法(leap frog method)
    リンク先は「リープ・フロッグ法」です。微分方程式の数値積分法 (常微分方程式の数値解法)の1つです。2次のシンプレクティック数値積分法です。

  • \(\boldsymbol{\rm F}_i (\boldsymbol{\rm r} (t))\)
    時刻\(t\)における座標\(\boldsymbol{\rm r} (t)\)から原子\(i\)に働く力のことです。
  • \[ \boldsymbol{\rm v}_i (t + \frac{\Delta t}{2}) = \boldsymbol{\rm v}_i (t) + \frac{\boldsymbol{\rm F}_i (\boldsymbol{\rm r} (t))}{m_i} \frac{\Delta t}{2} \]
page130
  • 図4.13
    ∆t=0.1としたときの調和振動子ののびq(実線)と速度v(破線)の時間変化です。
  • 調和振動子(harmonic oscillator)
    質点が定点からの距離に比例する引力を受けて運動する系です。調和振動子は定点を中心として振動する系であり、その運動は解析的に解くことができます。
  • 速度ベルレ法(velocity Verlet method)
    リンク先は「ベレの方法」です。分子動力学法などにおいて、原子間(粒子間)に働く力をもとに原子(粒子)を逐次的に動かす方法の1つです。ベレのアルゴリズム、ベレ法、ベルレの方法などともよばれます。
  • 振動(oscillation)
    状態が一意に定まらず揺れ動く事象のことです。
  • 角速度(angular velocity)
    ある点をまわる回転運動の速度を、単位時間に進む角度によって表わした物理量です。原点と物体を結ぶ線分、すなわち動径が向く角度の時間変化量と解釈してもよいです。
  • 四則演算(four arithmetic operations)
    リンク先は「算術」です。加法(addition)、減法(subtraction)、乗法(multiplication)除法 (division) の4つの演算のことです。
  • 解析解
    ある与えられた方程式について、誤差なく求められた解のことです。厳密解ともよばれます。偶数が出る確率をサイコロを何回も振って得られるような解は数値解とよばれます。
  • 正弦波(sine wave)
    正弦関数として観測可能な周期的変化を示す波動のことです。
  • 孤立系(isolated system)
    リンク先は「系 (自然科学)」です。物質もエネルギーも外界と交換しない系のことです。「物質の移動や熱、仕事、つまり、あらゆるエネルギーの移動を許さない系」という理解でもよいです。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 運動エネルギー(kinetic energy)
    物体の運動に伴うエネルギーです。物体の速度を変化させる際に必要な仕事という理解でもよいです。ニュートン力学において、物体の運動エネルギーは、物体の質量と速さの2乗に比例します。
  • 図4.14
    ∆tに対する∆Hのプロット(黒丸)と近似曲線です。
page131
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 共有結合(covalent bond)
    原子間での電子対の共有をともなう化学結合のことです。結合は非常に強く、ほとんどの分子は共有結合によって形成されます。

4.9.2 アンサンブルの生成

  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 溶液(solution)
    2つ以上の物質から構成される液体状態の混合物です。一般的には主要な液体成分の溶媒(solvent)と、その他の気体、液体、固体の成分である溶質(solute)とから構成されます。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。分子どうしの間の相互作用は分子間相互作用ですし、イオンどうしの相互作用はイオン間相互作用です。
  • コンフォメーション(conformation)
    リンク先は「立体配座」です。単結合についての回転や孤立電子対を持つ原子についての立体反転によって相互に変換可能な空間的な原子の配置のことです。立体配座は結合の回転に起因する自由度により、その取りうる状態の数が規定されます。したがって、取りうる立体配座の数は低分子から高分子へと分子を構成する単結合が増えるにつれて爆発的に増大します。
  • カノニカル分布(canonical distribution)
    リンク先は「正準集団」です。統計力学において、外界との間でエネルギーを自由にやり取り出来る閉鎖系を無数に集めた統計集団のことを正準集団とよびます。カノニカル分布は、この正準集団が従う確率分布のことであり、正準分布ともよばれます。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • ボルツマン定数(Boltzmann constant)
    統計力学において、状態数とエントロピーを関係付ける物理定数です。
  • 分配関数(partition function)
    ある系の物理量の統計集団的平均を計算する際に用いられる規格化定数を指します。単に分配関数と呼ぶときはカノニカル分布における分配関数を指します。
  • 物理量(physical quantity)
    物理学における一定の体系の下で次元が確定し、定められた物理単位の倍数として表すことができる量のことです。
  • 加重平均(weighted average)
    リンク先は「Weighted arithmetic mean」です。通常の算術平均に似ていますが、各データポイントが最終平均に等しく寄与するのではなく、一部のデータポイントが他のデータポイントより大きく寄与する点が異なります。この場合は、データポイント(状態iにおける値Ai)に付随する出現確率\(P_i\)が高いほどAiの重みが高く計算されるようなイメージになります。

  • 分子動力学法(molecular dynamics; MD)
    原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
  • カノニカル分布(canonical distribution)
    リンク先は「正準集団」です。統計力学において、外界との間でエネルギーを自由にやり取り出来る閉鎖系を無数に集めた統計集団のことを正準集団とよびます。カノニカル分布は、この正準集団が従う確率分布のことであり、正準分布ともよばれます。
  • 逐次的
    1つ1つ順を追って行なわれることです。
  • 座標(coordinates)
    点の位置を指定するために与えられる数の組(coordinates)、あるいはその各数(coordinate)のことです。
  • スナップショット(snapshot)
    一定の時間間隔ごとの、ある時点におけるシミュレーション対象の原子座標情報を記録したもの、という理解でよいです。
page132
  • Nose-Hoover chain法
    リンク先は「能勢=フーバー・サーモスタット」です。等温分子動力学シミュレーションのための決定的アルゴリズムです。初めに能勢修一によって開発され、フーバーによってさらに改良されたので、このような名前になっています。の熱浴はただ1つの想像上の粒子から成るが、シミュレーション系は現実的な定温条件(正準集団)を満たします。そのため、能勢=フーバー・サーモスタットは定温分子動力学シミュレーションのための最も正確かつ効率的な手法の1つとして一般的に使用されています。
  • Langevin dynamics
    リンク先は「ランジュバン動力学」です。分子系の動力学の数理モデリングのための手法です。確率微分方程式の使用によって省略された自由度を説明すると同時に単純化されたモデルを使うことが特徴です。
  • Berendsen法
    リンク先は「ベレンゼン・サーモスタット」です。分子動力学シミュレーションにおいてシミュレーション温度を制御するために粒子の速度の縮尺を変更するためのアルゴリズムです。カノニカル分布を与えない簡便な方法です。
  • 速度再スケール法(velocity rescaling method)
    Berendsen法を、カノニカル分布を与えるように改良したものです。
  • 確率密度(probability density)
    y = f(x)は、確率変数xの値が変わるとそれに応じてf(x)の値も変わるというものです。連続型確率変数の場合は、xがある一点の値をとる確率はゼロとなってしまいます。このため、xが横軸、f(x)が縦軸とすると、縦軸は「確率そのもの」ではなく「xの値がどれだけ出やすいか」というもので表します。それに相当するものが確率密度です。連続型確率変数というのは、足のサイズをx、身長をf(x)としたときに、足のサイズxは大体10cmから30cm程度まで連続的に値をとれます。このような足のサイズなどは連続型確率変数の例です。連続型確率変数の場合は、10-30cmの間でxが取りうる値は、たとえば18.5321578 cmなど無限にあります。なので、この足のサイズとなる確率を計算するとなるとP(x = 18.5321578)のようなことになってしまいます。なのでf(x)を確率密度関数とよびます。

  • 分配関数(partition function)
    ある系の物理量の統計集団的平均を計算する際に用いられる規格化定数を指します。単に分配関数と呼ぶときはカノニカル分布における分配関数を指します。
  • 構造アンサンブル(structural ensemble)
    (ある一定の条件のもとで生成された)構造の集合(集まり)のことです。
  • 分子動力学法(molecular dynamics; MD)
    原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
  • 理想気体(ideal gas)
    圧力が温度と密度に比例し、内部エネルギーが密度に依らない想像上の気体のことです。気体の最も基本的な理論モデルであり、より厳密な他の気体の理論モデルはすべて、低密度では理想気体に漸近します。
  • 状態方程式(equation of state) リンク先は「状態方程式 (熱力学)」です。熱力学において、状態量の間の関係式のことをいいます。巨視的な系の熱力学的性質を反映しており、系によって式の形は変化します。
  • 共有結合(covalent bond)
    原子間での電子対の共有をともなう化学結合のことです。結合は非常に強く、ほとんどの分子は共有結合によって形成されます。
  • 原子間相互作用
    リンク先は「原子間ポテンシャル」です。原子間相互作用自体は、言葉通りの原子間に働く相互作用のことです。原子間距離次第で、近すぎれば斥力が働き、遠くなると引力が働きます。原子間ポテンシャルはその状況を表したものです。
  • 周期境界条件(periodic boundary condition)
    リンク先は「周期的境界条件」です。境界条件とは、境界値問題に課される拘束条件のことです。境界条件は、境界値問題において興味のある解の探索領域とそれ以外の領域とを分けるために設定されます。境界上では、境界内部で成り立つ方程式だけでは解の形を決定することができないので、補助的な条件を設定することで解を定める必要があります。周期境界条件は、このような境界条件の1つです。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 図4.15
    周期境界条件。中央の青色地のセルが基本セル、それ以外のセルがイメージセルです。
  • 基本セル
    図4.15の中心の系のことです。
  • イメージセル
    図4.15中の基本セル以外のセルのことです。
  • 平行移動(translation)
    すべての点を決まった方向に一定の距離だけ動かす写像のことです。物理学における平行移動は並進運動(translational motion)とよばれます。
  • 共有結合(covalent bond)
    原子間での電子対の共有をともなう化学結合のことです。結合は非常に強く、ほとんどの分子は共有結合によって形成されます。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • Parrinello-Rahman法
    セルの辺の向きと長さの自由度を陽に考慮する圧力制御法です。
page133
  • 図4.15
    周期境界条件。中央の青色地のセルが基本セル、それ以外のセルがイメージセルです。

  • Berendsen法
    リンク先は「ベレンゼン・サーモスタット」です。分子動力学シミュレーションにおいてシミュレーション温度を制御するために粒子の速度の縮尺を変更するためのアルゴリズムです。カノニカル分布を与えない簡便な方法です。正しいアンサンブルを与えないが簡便な圧力制御法です。
  • Langevin piston法
    Berendsen法を正しいアンサンブルを与えるように改良した圧力制御法です。

4.9.3 シミュレーションの高速化

  • 表4.5

    分子動力学シミュレーションの計算時間の例です。Ttotalはシミュレーション全体の計算時間、Tnbは非共有結合相互作用の計算にかかった時間を表します。

    原子数 Ttotal [s] 比率 Tnb [s] Tnb/Ttotal
    3087 30.3 1.0 30.0 0.996
    6066 119.0 3.9 118.4 0.998
    10608 360.9 11.9 359.8 0.999

  • 水分子(water molecule)
    リンク先は「水」です。化学式 H2Oで表される、水素と酸素の化合物です。
  • 分子動力学シミュレーション(molecular dynamics simulation)
    リンク先は「分子動力学法」です。原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
  • 速度ベルレ法(velocity Verlet method)
    リンク先は「ベレの方法」です。分子動力学法などにおいて、原子間(粒子間)に働く力をもとに原子(粒子)を逐次的に動かす方法の1つです。ベレのアルゴリズム、ベレ法、ベルレの方法などともよばれます。
  • 非共有結合相互作用(non-covalent interaction)
    共有結合(原子間での電子対の共有をともなう化学結合のこと)以外の相互作用のことです。たとえば、van der Waals相互作用(原子、イオン、分子の間に働く分子間力のこと)、水素結合(水素原子が、近傍に位置した窒素、酸素、硫黄、フッ素、π(ぱい)電子系などの孤立電子対とつくる非共有結合性の引力的相互作用のこと)、そして静電相互作用(分子どうしや高分子内の離れた部分の間に働く電磁気学的な相互作用のこと)です。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 並列計算(parallel computing)
    コンピュータにおいて特定の処理をいくつかの独立した小さな処理に細分化し、複数の処理装置(プロセッサ)上でそれぞれの処理を同時に実行させることです。並列コンピューティングや並列処理ともよばれます。大きな問題を解いたり、大量のデータを処理したりする過程は「より小さなサブタスクやサブデータグループの処理に分割できることが多い」という事実を利用して単位時間あたりの処理効率(スループット)の向上を図る手法です。
  • GPU
    グラフィックス演算処理装置(Graphics Processing Uni)のことです。コンピュータゲームに代表されるリアルタイム画像処理に特化した演算装置あるいはプロセッサです。コンピュータが画面に表示する映像を描画するための処理を行うICから発展したものです。
  • 近似(approximation)
    数学や物理学において、複雑な対象の解析を容易にするため、細部を無視して、対象を単純化する行為、またはその方法のことです。

  • 速度ベルレ法(velocity Verlet method)
    リンク先は「ベレの方法」です。分子動力学法などにおいて、原子間(粒子間)に働く力をもとに原子(粒子)を逐次的に動かす方法の1つです。ベレのアルゴリズム、ベレ法、ベルレの方法などともよばれます。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。分子どうしの間の相互作用は分子間相互作用ですし、イオンどうしの相互作用はイオン間相互作用です。
  • 非共有結合相互作用(non-covalent interaction)
    共有結合(原子間での電子対の共有をともなう化学結合のこと)以外の相互作用のことです。たとえば、van der Waals相互作用(原子、イオン、分子の間に働く分子間力のこと)、水素結合(水素原子が、近傍に位置した窒素、酸素、硫黄、フッ素、π(ぱい)電子系などの孤立電子対とつくる非共有結合性の引力的相互作用のこと)、そして静電相互作用(分子どうしや高分子内の離れた部分の間に働く電磁気学的な相互作用のこと)です。
  • SHAKE法
    共有結合長を束縛することで、共有結合の伸縮運動を起こらなくする方法です。
page134
  • 図4.16
    カットオフ法の概要です。
  • 図4.17
    周期境界条件におけるカットオフ法です。

  • 共有結合(covalent bond)
    原子間での電子対の共有をともなう化学結合のことです。結合は非常に強く、ほとんどの分子は共有結合によって形成されます。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 水素(hydrogen)
    、原子番号1の元素です。元素記号はH。原子量は1.00794です。非金属元素の1つです。一般的に「水素」と言う場合、元素としての水素の他にも水素の単体である水素分子(水素ガス)H2、1個の陽子を含む原子核と1個の電子からなる水素原子、水素の原子核(ふつう1個の陽子、プロトン)などに言及している可能性があるため、文脈に基づいて判断する必要があります。
  • 水素原子(hydrogen atom)
    水素の原子であり、1つの陽子と1つの電子により構成されています。水素原子は宇宙の全質量の約75%を占めます。

  • 非共有結合相互作用(non-covalent interaction)
    共有結合(原子間での電子対の共有をともなう化学結合のこと)以外の相互作用のことです。たとえば、van der Waals相互作用(原子、イオン、分子の間に働く分子間力のこと)、水素結合(水素原子が、近傍に位置した窒素、酸素、硫黄、フッ素、π(ぱい)電子系などの孤立電子対とつくる非共有結合性の引力的相互作用のこと)、そして静電相互作用(分子どうしや高分子内の離れた部分の間に働く電磁気学的な相互作用のこと)です。
  • カットオフ法
    非共有結合相互作用計算の高速化を最も簡単に実現する方法です。非共有結合相互作用は原子どうしが遠くなるほど相互作用が弱くなることを利用して、一定の距離以上離れた原子ペアは相互作用していないとみなす近似法です。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。分子どうしの間の相互作用は分子間相互作用ですし、イオンどうしの相互作用はイオン間相互作用です。
  • 近似法(approximation method)
    関数の厳密値や方程式の厳密解を求めるときに、それが不可能または困難であるか、簡便のために近似値あるいは近似解を得る方法です。
  • 図4.16
    カットオフ法の概要です。
  • 速度ベルレ法(velocity Verlet method)
    リンク先は「ベレの方法」です。分子動力学法などにおいて、原子間(粒子間)に働く力をもとに原子(粒子)を逐次的に動かす方法の1つです。ベレのアルゴリズム、ベレ法、ベルレの方法などともよばれます。
  • 周期境界条件(periodic boundary condition)
    リンク先は「周期的境界条件」です。境界条件とは、境界値問題に課される拘束条件のことです。境界条件は、境界値問題において興味のある解の探索領域とそれ以外の領域とを分けるために設定されます。境界上では、境界内部で成り立つ方程式だけでは解の形を決定することができないので、補助的な条件を設定することで解を定める必要があります。周期境界条件は、このような境界条件の1つです。
  • 基本セル
    図4.15の中心の系のことです。
  • イメージセル
    図4.15中の基本セル以外のセルのことです。
page135
  • 図4.17
    周期境界条件におけるカットオフ法です。
  • minimum image convention
    rcを基本セルの最も短い辺の長さの半分以下になるように設定することです。
  • floor(x)
    xを超えない最大の整数を返す関数のことです。

  • カットオフ法
    非共有結合相互作用計算の高速化を最も簡単に実現する方法です。非共有結合相互作用は原子どうしが遠くなるほど相互作用が弱くなることを利用して、一定の距離以上離れた原子ペアは相互作用していないとみなす近似法です。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。分子どうしの間の相互作用は分子間相互作用ですし、イオンどうしの相互作用はイオン間相互作用です。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 非共有結合相互作用(non-covalent interaction)
    共有結合(原子間での電子対の共有をともなう化学結合のこと)以外の相互作用のことです。たとえば、van der Waals相互作用(原子、イオン、分子の間に働く分子間力のこと)、水素結合(水素原子が、近傍に位置した窒素、酸素、硫黄、フッ素、π(ぱい)電子系などの孤立電子対とつくる非共有結合性の引力的相互作用のこと)、そして静電相互作用(分子どうしや高分子内の離れた部分の間に働く電磁気学的な相互作用のこと)です。
  • van der Waals相互作用
    リンク先は「ファンデルワールス力」です。原子、イオン、分子の間に働く力(分子間力)の一種です。ファンデルワールス力によって分子間に形成される結合を、ファンデルワールス結合といいます。van der Waals力は、ヨハネス・ファン・デル・ワールスが実在気体の状態方程式を定式化した際に導入された凝縮力です。van der Waals相互作用は、これまでの説明部分で「力」を「相互作用」に置き換えたものだと解釈すればよいです。
  • 静電相互作用(electrostatic interaction)
    リンク先は「分子間力」です。分子どうしや高分子内の離れた部分の間に働く電磁気学的な力(相互作用)のことです。

  • 周期境界条件(periodic boundary condition)
    リンク先は「周期的境界条件」です。境界条件とは、境界値問題に課される拘束条件のことです。境界条件は、境界値問題において興味のある解の探索領域とそれ以外の領域とを分けるために設定されます。境界上では、境界内部で成り立つ方程式だけでは解の形を決定することができないので、補助的な条件を設定することで解を定める必要があります。周期境界条件は、このような境界条件の1つです。
  • イメージセル
    図4.15中の基本セル以外のセルのことです。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。分子どうしの間の相互作用は分子間相互作用ですし、イオンどうしの相互作用はイオン間相互作用です。
  • particle mesh Ewald(PME)
    周期境界条件において、イメージセルに含まれる原子との相互作用も含めて精度よく計算することができる方法です。
  • 静電ポテンシャル(electrostatic potential)
    リンク先は「電位」です。電荷に係る位置エネルギーのことです。
  • フーリエ変換(Fourier transform)
    実変数の複素または実数値関数を、別の同種の関数に写す変換です。
  • 離散化(discretization)
    連続関数、モデル、変数、方程式を離散的な対応する物へ移す過程のことです。連続的なデータ(この場合は電荷分布)を離散的なデータに変換することです。
  • 分子動力学法(molecular dynamics; MD)
    原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
  • 点電荷(point charge)
    電荷だけあって、大きさのない点状の物体のことです。正や負の電気を帯びた素粒子という理解でもよいです。
  • 標準偏差(standard deviation)
    データや確率変数の、平均値からの散らばり具合(ばらつき)を表す指標の1つです。分散(variance)の平方根(root)をとったものです。
  • 正規分布(normal distribution)
    確率論や統計学で用いられる連続的な変数に関する確率分布の1つです。データが平均値の付近に集積するような分布を表します。ガウス分布(Gaussian distribution)ともよばれます。中心極限定理(central limit theorem)により、独立な多数の因子の和として表される確率変数は正規分布に従います。
  • カットオフ法
    非共有結合相互作用計算の高速化を最も簡単に実現する方法です。非共有結合相互作用は原子どうしが遠くなるほど相互作用が弱くなることを利用して、一定の距離以上離れた原子ペアは相互作用していないとみなす近似法です。
  • 静電相互作用(electrostatic interaction)
    リンク先は「分子間力」です。分子どうしや高分子内の離れた部分の間に働く電磁気学的な力(相互作用)のことです。
  • Shan et al., J Chem Phys, 2005

page136
  • 図4.18
    分子動力学シミュレーションの計算時間の原子数依存性です。
  • 水分子(water molecule)
    リンク先は「水」です。化学式 H2Oで表される、水素と酸素の化合物です。
  • 周期境界条件(periodic boundary condition)
    リンク先は「周期的境界条件」です。境界条件とは、境界値問題に課される拘束条件のことです。境界条件は、境界値問題において興味のある解の探索領域とそれ以外の領域とを分けるために設定されます。境界上では、境界内部で成り立つ方程式だけでは解の形を決定することができないので、補助的な条件を設定することで解を定める必要があります。周期境界条件は、このような境界条件の1つです。
  • PME法
    particle mesh Ewald法のことです。周期境界条件において、イメージセルに含まれる原子との相互作用も含めて精度よく計算することができる方法です。
  • 静電相互作用(electrostatic interaction)
    リンク先は「分子間力」です。分子どうしや高分子内の離れた部分の間に働く電磁気学的な力(相互作用)のことです。
  • SHAKE法
    共有結合長を束縛することで、共有結合の伸縮運動を起こらなくする方法です。

4.9.4 分子動力学シミュレーションの実行

  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 分子動力学シミュレーション(molecular dynamics simulation)
    リンク先は「分子動力学法」です。原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
  • W4.6

    分子動力学シミュレーションに有用なサイトです。*1シミュレーションプログラムは一部有料です。*2学術利用は、シミュレーションプログラムの一部を除き無料です。商用利用は別ライセンスで有料です。*3商用利用は有料です。*4学術利用は無料です。商用利用は別ライセンスです。*5学術利用は無料です。商用利用は別ライセンスです。

    URL 内容
    http://ambermd.org/ Amber力場、Amber力場用セットアップ・シミュレーション・解析プログラム*1
    http://amber.manchester.ac.uk/ Amber parameter database
    http://mackerell.umaryland.edu/charmm_ff.shtml CAHRMM力場
    https://academiccharmm.org/ CHARMM力場用セットアップ・シミュレーション・解析プログラム*2
    https://charmm-gui.org/ CHARMM力場用セットアップWebサーバ*3
    https://www.ks.uiuc.edu/Research/namd/ シミュレーションプログラム(NAMD)*4
    https://www.ks.uiuc.edu/Research/vmd/ CHARMM力場用セットアップ・解析プログラム、トラジェクトリ可視化プログラム(VMD)*5
    http://www.gromacs.org/ シミュレーション・解析プログラム(GROMACS)
    https://www.r-ccs.riken.jp/labs/cbrt/ シミュレーション・解析プログラム(GENESIS)
    https://opm.phar.umich.edu/ OPMデータベース

  • 核酸(nucleic acid)
    リボ核酸 (RNA)とデオキシリボ核酸 (DNA)の総称で、塩基と糖、リン酸からなるヌクレオチドがホスホジエステル結合で連なった生体高分子のことです。

  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • PDB
    RCSB PDBにリンクを張っています。タンパク質,核酸,糖鎖など生体高分子の3次元構造の原子座標(立体配座)を蓄積している国際的な公共のデータベース(DB)です。
  • 配列(sequence)
    この場合は、アミノ酸配列のことです。
  • エントリ(entry)
    DBのアクセッション番号(accession number)や識別子(identifier; ID)のようなものだという理解でよいです。
  • NMR
    核磁気共鳴(nuclear magnetic resonance)のことです。外部静磁場に置かれた原子核が固有の周波数の電磁波と相互作用する現象です。核磁気共鳴は発見当初は原子核の内部構造を研究するための実験的手段と考えられていました。その後、原子核のラーモア周波数がその原子の化学結合状態などによってわずかながらも変化すること(化学シフト)が発見され、核磁気共鳴を物質の分析、同定の手段として用いることが考案されました。このように核磁気共鳴によるスペクトルを得る分光法を核磁気共鳴分光法と呼び、これも単にNMRと略称することが多いです。本文中で述べているNMRは、この分光法のことも指します。
  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • 分解能(optical resolution)
    装置などで対象を測定または識別できる能力。顕微鏡、望遠鏡、回折格子などにおける能力の指標の1つです。
  • 欠失残基(missing residue)
    残基全体の原子が欠失している場合に、その残基のことを欠失残基とよびます。
  • biological assemblyまたはbiological unit
    生物学的に機能しうる最小限の分子構成のことです。
  • 非対称単位(asymmetric unit)
    結晶構造の最も小さな単位構造のことです。
  • UCSF Chimera
    本章で主に用いている立体構造ビューアです。
  • Modeller
    比較モデリングを行う代表的なソフトウェアです。
  • 残基(residue)
    この場合は、アミノ酸残基のことを指します。タンパク質はアミノ酸から合成されるので、残基はポリペプチドのアミド結合(ペプチド結合)以外のアミノ酸構造のことです。
  • アセチル基(acetyl group)
    アシル基の一種で、酢酸からヒドロキシ基を取り除いたものにあたる1価の官能基です。構造式は「CH3CO−」と表され、しばしばAcと略記されます。
  • Nメチル基(N-methyl group)
    メチル基は、有機化学において「-CH3」と表される最も分子量の小さいアルキル置換基です。第1および第2アミンのNH基のHをメチル基に置き換えたもののがNメチル基です。
  • アミノ基(amino group) リンク先は「アミン」です。アンモニア、第一級アミン又は第二級アミンから水素を除去した、-NH2で表される1価の官能基のことです。芳香環上に置換すると電子供与基としての性質を示します。
  • カルボキシ基(carboxy group) -COOHで表される1価の基のことです。以前カルボキシル基(carboxyl group)とよばれていたものです。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。

page137
  • 図4.19
    ヒスチジンのプロトン化状態です。

  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • 水素原子(hydrogen atom)
    水素の原子であり、1つの陽子と1つの電子により構成されています。水素原子は宇宙の全質量の約75%を占めます。
  • プロトン化(protonation)
    原子、分子、イオンにプロトン(H+)を付加することです。
  • 脱プロトン化(deprotonation)
    分子からプロトン(H+)を除去して共役塩基を作る反応です。
  • 官能基(functional group)
    リンク先は「基」です。分子中に任意の境界を設定すると、原子が相互に共有結合で連結された部分構造を定義することができます。これは、基(または原子団)とよばれ、個々の原子団は「~基」(「メチル基」など)と命名されます。官能基は、物質の化学的属性や化学反応性に着目した概念で、官能基というときにはそれぞれに固有の物性や化学反応性が想定されています。
  • 水素結合(hydrogen bond)
    電気陰性度が大きな原子(陰性原子)に共有結合で結びついた水素原子が、近傍に位置した窒素、酸素、硫黄、フッ素、π電子系などの孤立電子対とつくる非共有結合性の引力的相互作用です。水素結合には、異なる分子の間に働くもの(分子間力)と単一の分子の異なる部位の間(分子内)に働くものがあります。
  • ヒスチジン(histidine)
    アミノ酸の一種で2-アミノ-3- (1H-イミダゾール-4-イル) プロピオン酸のことです。略号はHisあるいはHです。塩基性アミノ酸の一種で、必須アミノ酸です。糖原性を持します。側鎖にイミダゾイル基という複素芳香環を持ち、この部分の特殊な性質により酵素の活性中心や、蛋白質分子内でのプロトン移動に関与しています。蛋白質中では金属との結合部位となり、あるいは水素結合やイオン結合を介してその高次構造の維持に重要な役割を果たしています。
  • 図4.19
    ヒスチジンのプロトン化状態です。
  • アミノ基(amino group) リンク先は「アミン」です。アンモニア、第一級アミン又は第二級アミンから水素を除去した、-NH2で表される1価の官能基のことです。芳香環上に置換すると電子供与基としての性質を示します。
  • カルボニル基(carbonyl group)
    有機化学における置換基のひとつで、「−C(=O)−」と表される2価の官能基です。
  • 水素結合の受容体(acceptor)
    この場合は、受容体単体ではなく「水素結合(hydrogen bond)の受容体(水素結合受容体)」というひとまとまりで考えるとよいです。相対的に電気陰性度が高い原子と共有結合を形成している水素原子は、水素結合供与体(donor、ドナー)です。この場合の陰性原子はフッ素、酸素、窒素などである。フッ素、酸素、窒素などの陰性原子は、水素原子と共有結合しているかいないかにかかわらず、水素結合受容体(acceptor、アクセプター)となります。受容体の英単語がreceptorではなくacceptorである点に注意が必要です。
  • 水酸基(hydroxy group)
    リンク先は「ヒドロキシ基」です。有機化学において構造式が「−OH」と表される1価の官能基です。
  • アミノ酸(amino acid)
    広義には、アミノ基とカルボキシ基の両方の官能基を持つ有機化合物の総称です。狭義には、生体のタンパク質の構成ユニットとなる「α-アミノ酸」のことを指します。α-アミノ酸は、カルボキシ基が結合している炭素(α炭素)にアミノ基も結合しているアミノ酸であり、RCH(NH2)COOH という構造をもちます。このうちRに相当する部分は側鎖とよばれます。
  • PROPKA3Olsson et al., J Chem Theory Comput., 2011
    pKa予測プログラムです。
  • 硫黄(sulfur)
    原子番号16の元素です。元素記号はS。原子量は32.1です。酸素族元素の1つです。淡黄色で無味無臭であり、たびたび誤用される温泉街などで感じる「硫黄の臭い」は硫黄と水素の化合物である硫化水素によるものです。
  • ジスルフィド結合(disulfide bond)
    2組のチオール(水素化された硫黄を末端に持つ有機化合物)のカップリングで得られる共有結合です。

  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 低分子化合物(small molecule compound)
    分子量の小さい化合物のことです。分子量が1万以下のものを指すことが多いようです。
  • 非天然アミノ酸(unnatural amino acid)
    リンク先は「アミノ酸」です。天然には存在しないアミノ酸のことです。
  • 核酸(nucleic acid)
    リボ核酸 (RNA)とデオキシリボ核酸 (DNA)の総称で、塩基と糖、リン酸からなるヌクレオチドがホスホジエステル結合で連なった生体高分子のことです。
  • 修飾塩基(modified base)
    修飾を受けたヌクレオチドのことです。RNAが持つ塩基は通常、AUGCの4種ですが、一部のRNA (tRNA、rRNA、snRNAなど)は転写後修飾を受け、通常とは異なる構造の塩基、ヌクレオチドを含むことが多いです。修飾の種類としては、メチル化や脱アミノ化などがあげられます。
  • 力場パラメータ(force field parameter)
    リンク先は「力場 (化学)」です。粒子の系(通常分子および原子)のポテンシャルエネルギーを記述するために用いられるパラメータです。
  • Amber parameter database
    W4.6にリストアップされているものの1つです。
  • AmberTools
    2022年2月7日現在、AmberTools21が最新版のようです。
  • CAHRMM力場
    W4.6にリストアップされているものの1つです。
  • CAHRMM-GUI
    W4.6にリストアップされている中で「CHARMM力場用セットアップWebサーバ」と同じリンク先です。Ligand Reader & Modelerは、原著論文もあるようです(Kim et al., J Comput Chem., 2017)。
  • Zinc finger
    リンク先は「ジンクフィンガー」です。タンパク質ドメインの大きなスーパーファミリーの1つで、DNAに結合する性質をもちます。ジンクフィンガーは2つの逆平行βシートと1つのαヘリックスからなります。小さすぎて疎水中心を持たないため亜鉛イオンが安定化にとって重要です。亜鉛イオンがDNAと結合して特別な構造モチーフを形成するため、ジンクフィンガーは遺伝子調節に重要な役割を果たします。Zinc fingerモチーフは、このような「亜鉛イオンがDNAと結合して特別な構造モチーフを形成する」ことを指す言葉です。
  • アミノ酸(amino acid)
    広義には、アミノ基とカルボキシ基の両方の官能基を持つ有機化合物の総称です。狭義には、生体のタンパク質の構成ユニットとなる「α-アミノ酸」のことを指します。α-アミノ酸は、カルボキシ基が結合している炭素(α炭素)にアミノ基も結合しているアミノ酸であり、RCH(NH2)COOH という構造をもちます。このうちRに相当する部分は側鎖とよばれます。
  • 配位(coordination)
    リンク先は「配位結合」です。本文中の「配位している」というのは、事実上「配位結合している」と同義です。配位結合(coordinate bondまたはdative bond)とは、結合を形成する二つの原子の一方からのみ結合電子が分子軌道に提供される化学結合のことです。
  • 配位子(ligand)
    金属に配位する化合物のことです。配位子は孤立電子対を持つ基を有しており、この基が金属と配位結合し、錯体を形成します。
  • ヒスチジン(histidine)
    アミノ酸の一種で2-アミノ-3- (1H-イミダゾール-4-イル) プロピオン酸のことです。略号はHisあるいはHです。塩基性アミノ酸の一種で、必須アミノ酸です。糖原性を持します。側鎖にイミダゾイル基という複素芳香環を持ち、この部分の特殊な性質により酵素の活性中心や、蛋白質分子内でのプロトン移動に関与しています。蛋白質中では金属との結合部位となり、あるいは水素結合やイオン結合を介してその高次構造の維持に重要な役割を果たしています。
  • システイン(cysteine)
    アミノ酸の一種でチオセリンともいいます。略号はCysあるいはCです。ヒトでは必須アミノ酸ではなくメチオニンから生合成されます。疎水性アミノ酸、中性極性側鎖アミノ酸に分類されているが、非常に反応性に富んでいます。

  • 水溶性タンパク質(soluble protein)
    タンパク質は、その一部が脂質二重膜の中に存在するもの(膜タンパク質)としないもの(水溶性タンパク質)に大別可能ですが、後者のことを指す言葉です。歴史的に膜タンパク質は構造決定が難しかったため、このような分類がなされることが多いです。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 水分子(water molecule)
    リンク先は「水」です。化学式 H2Oで表される、水素と酸素の化合物です。
  • 周期境界条件(periodic boundary condition)
    リンク先は「周期的境界条件」です。境界条件とは、境界値問題に課される拘束条件のことです。境界条件は、境界値問題において興味のある解の探索領域とそれ以外の領域とを分けるために設定されます。境界上では、境界内部で成り立つ方程式だけでは解の形を決定することができないので、補助的な条件を設定することで解を定める必要があります。周期境界条件は、このような境界条件の1つです。
  • 直方体(cuboid)
    すべての面が長方形(正方形も長方形の一種である))構成される六面体(面が6つある多面体)です。隣接する面が直角に交わるのが特徴です。
page138
  • イメージセル
    図4.15中の基本セル以外のセルのことです。
  • PME法
    particle mesh Ewald法のことです。周期境界条件において、イメージセルに含まれる原子との相互作用も含めて精度よく計算することができる方法です。
  • 電荷(electric charge)
    粒子や物体が帯びている電気の量であり、また電磁場から受ける作用の大きさを規定する物理量です。 荷電ともよばれます。
  • カウンターイオン(counterion)
    リンク先は「Counterion」です。電気的中性を維持するためにイオン種に付随するイオンのことです。たとえば食卓塩の場合は、塩化物イオンのカウンターイオンは、ナトリウムイオンです。
  • NaCl
    リンク先は「塩化ナトリウム」です。ナトリウムの塩化物です。単に塩(しお)、あるいは食塩とよばれる場合も多いです。
  • KCl
    リンク先は「塩化カリウム」です。カリウムの塩化物で、結晶格子は塩化ナトリウム型構造をとります。食卓塩および食物に含まれるため日常的に摂取されています。水溶液中では電離してカリウムイオン(K+)と塩化物イオン(Cl-)になります。
  • AmberTools
    2022年2月7日現在、AmberTools21が最新版のようです。

  • 膜タンパク質(membrane protein)
    細胞または細胞小器官などの生体膜に付着しているタンパク質分子です。膜タンパク質は、膜との関係の強さによって内在性膜タンパク質(integral membrane protein)と表在性膜タンパク質(peripheral membrane protein)の2種類に大別できます。
  • 脂質二重層(lipid bilayer)
    極性を持った薄いリン脂質が二層になった膜です。ほぼすべての生物で細胞膜の基本構造として利用されています。
  • X線結晶構造解析(X-ray crystallography)
    結晶の原子および分子構造を決定する実験科学であり、結晶構造により入射するX線のビームが多くの特定の方向に回折します。これらの回折したビームの角度と強度を測定することで、結晶内の電子密度の3次元画像を作成することができます。この電子密度から、結晶内の原子の平均位置、化学結合、結晶学的無秩序、およびその他の様々な情報を決定することができることを利用した解析です。
  • PDB
    RCSB PDBにリンクを張っています。タンパク質,核酸,糖鎖など生体高分子の3次元構造の原子座標(立体配座)を蓄積している国際的な公共のデータベース(DB)です。
  • OPMデータベース
    W4.6の一番下にリストアップされているDBです。Orientations of Proteins in Membranesの略で、脂質二重層に対するタンパク質の向きと位置が登録されています。
  • 分子動力学シミュレーション(molecular dynamics simulation)
    リンク先は「分子動力学法」です。原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
  • Positioning of Proteins in Membrane (PPM)サーバ
    タンパク質の脂質二重層内の向きと位置を予測するWebサーバです。
  • CAHRMM-GUI
    W4.6にリストアップされているものの1つです。
  • CAHRMM-GUIのMembrane Builder
    リンク先はMembrane BuilderのTutorialです。
  • 水分子(water molecule)
    リンク先は「水」です。化学式 H2Oで表される、水素と酸素の化合物です。
  • プロトン化(protonation)
    原子、分子、イオンにプロトン(H+)を付加することです。
  • 脱プロトン化(deprotonation)
    分子からプロトン(H+)を除去して共役塩基を作る反応です。
  • ジスルフィド結合(disulfide bond)
    2組のチオール(水素化された硫黄を末端に持つ有機化合物)のカップリングで得られる共有結合です。
  • システイン(cysteine)
    アミノ酸の一種でチオセリンともいいます。略号はCysあるいはCです。ヒトでは必須アミノ酸ではなくメチオニンから生合成されます。疎水性アミノ酸、中性極性側鎖アミノ酸に分類されているが、非常に反応性に富んでいます。
  • 大腸菌(Escherichia coli)
    グラム陰性の桿菌(かんきん)で通性嫌気性菌に属し、環境中に存在する細菌(バクテリア)の主要な種(species)の1つです。
  • 1-palmitoyl-2-oleoyl-sn-glycero-3-phosphoethanolamine (POPE)
    大腸菌由来のタンパク質の場合に用いる細胞膜の組成です。
  • 1-palmitoyl-2-oleoyl-sn-glycero-3-phosphocholine (POPC)
    リンク先は「POホスファチジルコリン」です。真核生物由来のタンパク質の場合に用いる細胞膜の組成です。
  • 電荷(electric charge)
    粒子や物体が帯びている電気の量であり、また電磁場から受ける作用の大きさを規定する物理量です。 荷電ともよばれます。

  • エネルギー最小化(energy minimization)
    リンク先は「Energy minimization」です。とりうる様々なコンフォメーションの中から、エネルギーが最小の立体構造を得る作業のことです。構造最適化ともよばれます。エネルギー最小化計算では、原子どうしのぶつかりの排除や、局所的な歪みの補正が行われます。
  • 平衡化(equilibration)
    リンク先は「平衡」です。平衡化は、エネルギー最小化計算作業の後に行われます。エネルギー最小化計算では原子どうしのぶつかりを排除し局所的な歪みを正すだけなので、平衡化の初期段階では「タンパク質の周囲に機械的に配置した水分子や脂質分子が、タンパク質と適切な相互作用を形成できるような状態になってはいません。平衡化は、これらの相互作用が適切に形成されるように「大局的な最適化」を行う作業です。なお、本文中の「初期構造」は「エネルギー最小化計算前の構造」に相当します。水分子や脂質分子を機械的に配置したのは、エネルギー最小化計算前です。
  • Amber力場、Amber力場用セットアップ・シミュレーション・解析プログラム
    W4.6にリストアップされているものの1つです。
  • CAHRMM力場
    W4.6にリストアップされているものの1つです。
  • NAMD
    W4.6にリストアップされているものの1つです。フリーウェアの分子動力学シミュレーションパッケージの1つです。NAnoscale Molecular Dynamics programの略です。
  • GROMACS
    W4.6にリストアップされているものの1つです。分子動力学シミュレーションのソフトウェアパッケージです。「グローマックス」と読み、Groningen Machine for Chemical Simulationsの略です。
  • GENESIS
    W4.6にリストアップされているものの1つです。分子動力学シミュレーションのソフトウェアパッケージです。理化学研究所から提供されています。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 水分子(water molecule)
    リンク先は「水」です。化学式 H2Oで表される、水素と酸素の化合物です。
  • 脂質(lipid)
    リンク先は「脂肪」です。炭水化物、タンパク質と共に「三大栄養素」と総称され、多くの生物種の栄養素です。脂肪のカロリーは9kcal/gであり、炭水化物、タンパク質の4kcal/gよりも単位重量あたりの熱量が大きく、哺乳類をはじめとして動物の栄養の摂取や貯蔵方法として多く利用されています。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。分子どうしの間の相互作用は分子間相互作用ですし、イオンどうしの相互作用はイオン間相互作用です。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • 分子動力学シミュレーション(molecular dynamics simulation)
    リンク先は「分子動力学法」です。原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
page139

4.9.5 分子動力学シミュレーションの応用

  • 分子動力学シミュレーション(molecular dynamics simulation)
    リンク先は「分子動力学法」です。原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
  • de Groot and Grubmüller, Science, 2001
    水チャネルAquaporinの分子動力学シミュレーションを行った論文です。
  • Aquaporin
    リンク先は「アクアポリン」です。細胞膜に存在する細孔(pore)を持ったタンパク質である。MIP (major intrinsic proteins)ファミリーに属する膜内在タンパク質の一種です。細胞への水の取り込みに関係しており、水分子のみを選択的に通過させることができます。それゆえ、水チャネル(water channel)ともよばれます。
  • 水分子(water molecule)
    リンク先は「水」です。化学式 H2Oで表される、水素と酸素の化合物です。
  • Lindorff-Larsen et al., Science, 2011
    小タンパク質に対して、伸びた構造から天然構造に折りたたむ過程を、分子動力学シミュレーションを用いて追跡した論文です。
  • 変性(denaturation)
    生体高分子の変性とは、ポリマーの二次構造が破壊されることをいい、核酸やタンパク質などの生体高分子は高次構造を失い変化することです。核酸やタンパク質の三次構造が壊れた状態はランダムコイルに近いが、このような生体高分子の変性の結果である状態を変性した状態とよびます。
  • 転移温度(transition temperature)
    相転移を起こす温度のことです。
  • ラムダリプレッサー(λ-repressor)
    ラムダファージの溶原化に必要なタンパク質です。
  • フォールディング(folding)
    タンパク質は立体構造(三次構造)をとって本来の機能を果たしますが、アミノ酸配列の一次構造が”折りたたまれて”立体構造を形成します。この折りたたまれること(または折りたたみ構造をとること)をフォールディングといいます。
  • アンフォールディング(unfolding)
    タンパク質の折りたたみ構造がほどけることです。
  • 1LMB
    λ-repressorの天然構造のPDBエントリです。
  • RMSD
    リンク先は「原子位置の平均二乗偏差」です。根平均二乗変位(root mean square deviation)のことです。この業界では、RMSD(あーるえむえすでぃー、と読みます)という用語が一般的です。数値が低ければ低いほど精度がよいと判断します。最小値は0Å(オングストローム)です。
  • Dror et al., Proc Natl Acad Sci USA., 2011
    はβ2-adrenergic receptorへの拮抗薬alprenololの結合シミュレーションを行った論文です。
  • β2アドレナリン受容体(β2-adrenergic receptor)
    リンク先は「アドレナリン受容体」です。アドレナリン、ノルアドレナリンを始めとするカテコールアミン類によって活性化されるGタンパク共役型の受容体です。主に心筋や平滑筋に存在し、脳や脂肪細胞にもあります。β2アドレナリン受容体は、アドレナリン受容体のサブタイプの1つです。
  • 拮抗薬(antagonist)
    リンク先は「アンタゴニスト」です。生体内の受容体分子に働いて神経伝達物質やホルモンなどの働きを阻害する薬のことです。作用自体はないが受容体に可逆的に結合するため、濃度支配的に受容体が本来のリガンド分子と結合する部位を奪い合うことによってアゴニストの作用を阻害する競合的拮抗薬(コンペティティブ・アンタゴニスト)と、受容体の結合定数に影響をおよぼしたり受容体と不可逆的に結合したりするなどしてアゴニストの作用を阻害する非競合的拮抗薬(ノンコンペティティブ・アンタゴニスト)があります。
  • alprenolol
    リンク先は「アルプレノロール」です。5-HT1A受容体のアンタゴニスト(拮抗薬)であるとともに、非選択的交感神経β受容体遮断薬です。狭心症の治療に用いられます。

  • カノニカル分布(canonical distribution)
    リンク先は「正準集団」です。統計力学において、外界との間でエネルギーを自由にやり取り出来る閉鎖系を無数に集めた統計集団のことを正準集団とよびます。カノニカル分布は、この正準集団が従う確率分布のことであり、正準分布ともよばれます。
  • 立体構造予測(protein structure prediction)
    リンク先は「タンパク質構造予測」です。タンパク質についてそのアミノ酸配列をもとに3次元構造(立体配座)を推定することであり、バイオインフォマティクスおよび計算化学における研究分野の1つです。
  • 分子動力学シミュレーション(molecular dynamics simulation)
    リンク先は「分子動力学法」です。原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
  • 6LCF
    β-L-アラビノビオース結合タンパク質と基質の複合体(ホロ構造)のPDBエントリです。
  • ホロ構造(holo structure)
    リンク先は「ホロ酵素」です。タンパク質分子に、基質など非タンパク質性の分子が結合したものの構造を指します。ホロ(holo)は「全体」という意味です。
  • アポ構造(apo structure)
    リンク先は「アポタンパク質」です。タンパク質から、ある機能をもった部分を取り除いた残りの構造を指します。アポは「~から離れる」という意味です。
  • 基質(substrate)
    リンク先は「基質 (化学)」です。化学反応において他の試薬と反応して生成物を作る化学種の1つです。
  • Miyake et al., FEBS J., 2020
    β-L-アラビノビオース結合タンパク質と基質との複合体(ホロ構造;PDB ID: 6LCF)の構造から、基質を取り除いたアポ構造のモデルを作成し、分子動力学シミュレーションを実施したという論文です。
  • ドメイン(domain)
    リンク先は「タンパク質ドメイン」です。タンパク質の配列、構造の一部で他の部分とは独立に進化し、機能を持った存在です。それぞれのドメインはコンパクトな三次元構造を作り、独立に折りたたまれ、安定化されることが多いです。多くのタンパク質がいくつかのドメインより成り立ち、1つのドメインは進化的に関連した多くのタンパク質の中に現れます。ドメインの長さは様々で、25残基程度から500残基以上に及ぶものもあります。有名なジンクフィンガーのような最も短いドメインは、金属イオンやジスルフィド結合によって安定化されます。
  • 大腸菌(Escherichia coli)
    グラム陰性の桿菌(かんきん)で通性嫌気性菌に属し、環境中に存在する細菌(バクテリア)の主要な種(species)の1つです。
  • 対向輸送(antiport)
    リンク先は「アンチポート」です。細胞膜に存在する膜輸送タンパク質によって、2種類以上の分子またはイオンを反対方向に輸送する機構のことです。
  • 多剤排出トランスポータ(multidrug antiporter)
    細菌の膜上に存在する膜タンパク質の中で、多種類の薬剤を細胞外へ排出する機能をもったもののことです。
  • 酸性残基(acidic residues)
    極性アミノ酸残基の中で、負電荷をもつアミノ酸残基のことです。具体的には、アスパラギン酸(3文字表記はAsp、1文字表記はD)とグルタミン酸(3文字表記はGlu、1文字表記はE)のことです。
  • プロトン化(protonation)
    原子、分子、イオンにプロトン(H+)を付加することです。
  • Nagarathinam et al., Nat Commun., 2018
    大腸菌に存在する薬剤と水素イオンを対向輸送する多剤排出トランスポータについて、酸性残基をプロトン化して分子動力学シミュレーションを行った論文です。
  • ペリプラズム(periplasmic space)
    グラム陰性菌において、細胞膜と細胞外膜の2枚の生体膜に囲まれた空間のことです。
  • 水素イオン(hydrogen ion)
    国際純正・応用化学連合によって、水素およびその同位体のすべてのイオンを表す一般名として勧告されています。イオンの電荷に依って、陽イオンと陰イオンの2つの異なる分類に分けることができます。

  • 分子動力学シミュレーション(molecular dynamics simulation)
    リンク先は「分子動力学法」です。原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
  • カノニカル分布(canonical distribution)
    リンク先は「正準集団」です。統計力学において、外界との間でエネルギーを自由にやり取り出来る閉鎖系を無数に集めた統計集団のことを正準集団とよびます。カノニカル分布は、この正準集団が従う確率分布のことであり、正準分布ともよばれます。
  • 構造アンサンブル(structural ensemble)
    この場合は、カノニカル分布に従う構造の集合のことです。
  • 自由エネルギー(free energy)
    熱力学における状態量の1つであり、化学変化を含めた熱力学的系の等温過程において、系の最大仕事(潜在的な仕事能力)、自発的変化の方向、平衡条件などを表す指標です。
  • おたふくかぜウイルス(Mumps orthorubulavirus)
    リンク先は「ムンプスウイルス」です。ムンプスウイルス(Mumps orthorubulavirus)は、パラミクソウイルス科ルブラウイルス亜科オルトルブラウイルス属に属する流行性耳下腺炎(おたふく風邪)の原因ウイルスです。
  • ヘマグルチニン-ノイラミニダーゼ(hemagglutinin-neuraminidase)
    ヘマグルチニンとノイラミニダーゼEC 3.2.1.18の両方の活性を持つ単一のウイルス性タンパク質です。上記のおたふくかぜウイルス(Mumps orthorubulavirus)を含むいくつかのウイルス群においては、ヘマグルチニン-ノイラミニダーゼタンパク質1つで、ノイラミニダーゼ(neuraminidase)とヘマグルチニン(hemagglutinin)の両方の機能を果たしています。「ウイルス・ノイラミニダーゼ」で、それぞれの機能について解説されています。
  • 糖鎖(glycan)
    各種の糖がグリコシド結合によってつながりあった一群の化合物のことです。結合した糖の数は2つから数万まで様々であり、10個程度までのものをオリゴ糖ともよびます。多数のα-グルコース分子が直線上に結合したアミロースやセルロースは最も単純な糖鎖といえます。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。分子どうしの間の相互作用は分子間相互作用ですし、イオンどうしの相互作用はイオン間相互作用です。
  • アミノ酸残基(amino acid residue)
    リンク先は「残基」です。タンパク質は構成単位であるモノマーが多数連結(重合)してできた高分子化合物であり、化学結合の構造部分とそれ以外の部分に分けられます。このうち後者の「化学結合以外の部分構造」のことを残基といいます。タンパク質はアミノ酸から合成されるので、残基はポリペプチドのアミド結合(ペプチド結合)以外のアミノ酸構造を意味します。また、タンパク質は、その残基部分の特性によって様々に変化するため、「アミノ酸残基」という表現がよくなされます。
  • Kubota et al., Proc Natl Acad Sci USA., 2016
    分子動力学シミュレーショをおたふくかぜウイルスの表面に存在するhemagglutinin-neuraminidaseと細胞表面に存在する糖鎖の相互作用解析に適用し、糖鎖が2糖と3糖では、3糖の親和性が高いこと、3番目の糖と相互作用しているアミノ酸残基を置換すると親和性が低下することを計算により示したという論文です。
  • DNA配列(DNA sequences)
    リンク先は「塩基配列」です。核酸の一種であるDNAにおいて、それを構成しているヌクレオチドの結合順を、ヌクレオチドの一部をなす有機塩基類の種類に注目して記述する方法、あるいは記述したもののことです。単にシークエンスあるいはシーケンスとよぶことも多いです。
  • 転写因子(transcription factor; TF)
    DNAに特異的に結合するタンパク質のことです。DNA上のプロモータ領域に、基本転写因子とよばれるものと、RNAポリメラーゼ(RNA合成酵素)が結合し、転写が開始します。DNAの遺伝情報をRNAに転写する過程を促進、あるいは逆に抑制します。転写因子はこの機能を単独で、または他のタンパク質と複合体を形成することによって実行します。ヒトのゲノム上には、転写因子をコードする遺伝子がおよそ1,800個程度存在するとの推定がなされています。
  • Nosaki et al., Sci Rep., 2021
    同じDNA配列を認識する2種類の転写因子について、認識配列中のG-CペアをA-Tペアに相互に置換したときの親和性の変化を計算した論文です。
page140

4.10 立体構造予測

  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • 配列一致度(sequence identity)
    比較する2本の配列が似ている度合いを表す指標の1つです。配列のアラインメントをとったとき、対応する文字が一致する割合を示すものです。分子(numerator)が「対応する文字が一致する数」、分母(denominator)が「アラインメントの長さ」です。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 比較モデリング
    リンク先は「タンパク質構造予測」です。立体構造未知のタンパク質の立体構造を予測する問題において、既に立体構造が解明されている相同なタンパク質が存在する場合は、その既知構造と似ているはずだという考えに立脚した構造予測法です。ホモロジーモデリングともよばれます。
  • 鋳型(template)
    この場合は、比較モデリングを実行するにあたり、参考にする構造既知のタンパク質のことです。
  • W4.7

    タンパク質の立体構造予測のためのソフトウェアとWebサイトです。

    名称 URL
    Modeller https://salilab.org/modeller/
    Swiss-Model https://swissmodel.expasy.org/
    AlphaFold Protein Structure Database https://alphafold.ebi.ac.uk/

  • Modeller
    比較モデリングを行う代表的なソフトウェアです。政府系研究機関、商用利用は有料です。
  • 比較モデリング
    リンク先は「タンパク質構造予測」です。立体構造未知のタンパク質の立体構造を予測する問題において、既に立体構造が解明されている相同なタンパク質が存在する場合は、その既知構造と似ているはずだという考えに立脚した構造予測法です。ホモロジーモデリングともよばれます。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • 主鎖(main chain)
    タンパク質は20種類のα-アミノ酸が鎖状に多数連結(重合)してできた高分子化合物ですが、この鎖を構成しているのは、α-アミノ酸のRCH(NH2)COOH という構造のうち、側鎖に相当するR以外の部分になります。このR以外の部分を主鎖といいます。
  • 側鎖(side chain)
    主鎖(またはバックボーン)とよばれる分子の中心部分に結合している化学基(置換基)のことです。α-アミノ酸のRCH(NH2)COOH という構造のうち、Rに相当する部分が側鎖です。タンパク質の性質は側鎖によって決まります。
  • 二面角(dihedral angle)
    2つの平面(またはその部分集合)がなす角度である。たとえば、二面角が0なら2面は平行(同一の場合を含む)で、π/2 (つまり90度)なら垂直です。
  • C\(\alpha\)原子
    リンク先は「タンパク質構造」です。ここの「側鎖のコンフォメーション」という項目で、C\(\alpha\)原子(しーあるふぁげんし、と読む)を含む解説があります。C\(\alpha\)はアミノ酸のカルボキシル基に最も近い炭素原子を表し、通常は主鎖の一部であると考えられています。
  • 確率分布関数(probability distribution function; PDF)
    大まかには、たとえばアミノ酸残基の1文字表記でGLN(グリシン - ロイシン - アスパラギン)という3つのアミノ酸残基の並びをもつが既知の立体構造ではどのような構造をとりやすいかという統計をとれますので、それを表現したようなものだという理解でよいです。いわゆるPDFファイルの正式名称のPortable Document Formatではありませんのでご注意ください。
  • Sali and Blundell, J Mol Biol., 1993
  • 条件付き確率(conditional probability)
    ある事象Bが起こるという条件下での別の事象Aの確率のことであり、P(A|B)のように表されます。条件付き確率P(A|B)はしばしば「Bが起こったときのAの(条件付き)確率」「条件Bの下でのAの確率」などと表現されます。
  • αヘリックス(alpha helix)
    タンパク質の二次構造の共通モチーフの1つで、ばねに似た右巻きらせんの形をしています。骨格となるアミノ酸のすべてのアミノ基は、4残基離れたカルボキシ基と水素結合を形成しています。
  • アラインメント(alignment)
    リンク先は「シーケンスアラインメント」です。手元に複数の塩基配列(またはアミノ酸配列)があったときに、類似した領域を特定できるように並べたもの(または並べること)です。
  • 残基(residue)
    この場合は、アミノ酸残基のことを指します。タンパク質はアミノ酸から合成されるので、残基はポリペプチドのアミド結合(ペプチド結合)以外のアミノ酸構造のことです。
  • アミノ酸(amino acid)
    広義には、アミノ基とカルボキシ基の両方の官能基を持つ有機化合物の総称です。狭義には、生体のタンパク質の構成ユニットとなる「α-アミノ酸」のことを指します。α-アミノ酸は、カルボキシ基が結合している炭素(α炭素)にアミノ基も結合しているアミノ酸であり、RCH(NH2)COOH という構造をもちます。このうちRに相当する部分は側鎖とよばれます。
  • コンフォメーション(conformation)
    リンク先は「立体配座」です。単結合についての回転や孤立電子対を持つ原子についての立体反転によって相互に変換可能な空間的な原子の配置のことです。立体配座は結合の回転に起因する自由度により、その取りうる状態の数が規定されます。したがって、取りうる立体配座の数は低分子から高分子へと分子を構成する単結合が増えるにつれて爆発的に増大します。
  • 溶媒露出度(solvent exposureまたはsolvent accessibility)
    水溶性タンパク質で考えると、タンパク質内部の残基はタンパク質のまわりにある溶媒に触れる度合いが低く、タンパク質表面にある残基は溶媒に触れる度合いが高いことが想像できます。このような残基の溶媒に触れる度合いのことです。溶媒露出表面積(accessible surface area)の略としてASAという言葉もよく用いられます。
  • 確率密度(probability density)
    y = f(x)は、確率変数xの値が変わるとそれに応じてf(x)の値も変わるというものです。連続型確率変数の場合は、xがある一点の値をとる確率はゼロとなってしまいます。このため、xが横軸、f(x)が縦軸とすると、縦軸は「確率そのもの」ではなく「xの値がどれだけ出やすいか」というもので表します。それに相当するものが確率密度です。連続型確率変数というのは、足のサイズをx、身長をf(x)としたときに、足のサイズxは大体10cmから30cm程度まで連続的に値をとれます。このような足のサイズなどは連続型確率変数の例です。連続型確率変数の場合は、10-30cmの間でxが取りうる値は、たとえば18.5321578 cmなど無限にあります。なので、この足のサイズとなる確率を計算するとなるとP(x = 18.5321578)のようなことになってしまいます。なのでf(x)を確率密度関数とよびます。

  • 確率分布関数(probability distribution function; PDF)
    大まかには、たとえばアミノ酸残基の1文字表記でGLN(グリシン - ロイシン - アスパラギン)という3つのアミノ酸残基の並びをもつが既知の立体構造ではどのような構造をとりやすいかという統計をとれますので、それを表現したようなものだという理解でよいです。いわゆるPDFファイルの正式名称のPortable Document Formatではありませんのでご注意ください。
  • 分子力学法(molecular mechanics)
    分子の立体配座の安定性や配座間のエネルギー差を原子間に働く力によるポテンシャルエネルギーの総和によって計算する手法のことです。分子の持つエネルギーはシュレーディンガー方程式を解くことによって計算することが可能であるが、これは分子を構成する原子および電子の数が多くなると計算量が急激に増加し困難になります。しかしその一方で、分子の内部の原子どうしに働く力はその原子の種類や結合様式が同じならば、別の種類の分子でもほぼ同じです。そこで原子間に働くすべての力を、原子間の結合を表すパラメータ(結合距離、結合角など)を変数とし、原子の種類や結合様式によって決まる関数で表します。そしてそれらの力によるポテンシャルエネルギーの総和が分子の持つエネルギーとなっていると考えます。このような考えのもとに、様々な実験値をうまく説明できるような原子間のポテンシャルエネルギーを表す式を経験的に、あるいは量子化学的手法によって導き、それによって分子の立体配座の安定性や配座間のエネルギー差を計算する手法が分子力学法です。
  • ポテンシャルエネルギー(potential energy)
    リンク先は「位置エネルギー」です。物体が「ある位置」にあることで物体にたくわえられるエネルギーのことです。ポテンシャルエネルギーは、位置エネルギーのことであり、単にポテンシャルともよばれます。
  • 共役勾配法(conjugate gradient method)
    対称正定値行列を係数とする連立一次方程式を解くためのアルゴリズムです。反復法として利用され、コレスキー分解のような直接法では大きすぎて取り扱えない、大規模な疎行列を解くために利用されます。エネルギー最小化などの最適化問題を解くために用いることもできます。
  • 分子動力学シミュレーション(molecular dynamics simulation)
    リンク先は「分子動力学法」です。原子ならびに分子の物理的な動きのコンピューターシミュレーション手法です。原子および分子はある時間の間相互作用することが許され、これによって原子の動的発展の光景が得られます。最も一般的なMD法では、原子および分子のトラクジェクトリは、相互作用する粒子の系についての古典力学におけるニュートンの運動方程式を数値的に解くことによって決定されます。
  • 鋳型(template)
    この場合は、比較モデリングを実行するにあたり、参考にする構造既知のタンパク質のことです。
  • 加重平均(weighted average)
    リンク先は「Weighted arithmetic mean」です。通常の算術平均に似ていますが、各データポイントが最終平均に等しく寄与するのではなく、一部のデータポイントが他のデータポイントより大きく寄与する点が異なります。この場合は、データポイント(状態iにおける値Ai)に付随する出現確率\(P_i\)が高いほどAiの重みが高く計算されるようなイメージになります。

page141
  • 例題4.3
    1ページ目が問題、2ページ目以降が解答例です。
    • ジヒドロ葉酸還元酵素(dihydrofolate reductase; DHFR)
      リンク先は「ジヒドロ葉酸レダクターゼ」です。NADPHを電子供与体としてジヒドロ葉酸をテトラヒドロ葉酸に還元する酵素です。ヒトではDHFR遺伝子にコードされています。
    • ジヒドロ葉酸(dihydrofolic)
      ジヒドロ葉酸還元酵素(EC 1.5.1.3)によってテトラヒドロ葉酸を生成する葉酸誘導体です。ジヒドロ葉酸は細菌の細胞分裂に影響します。
    • NADPH
      リンク先は「ニコチンアミドアデニンジヌクレオチドリン酸」です。光合成経路あるいは解糖系のエントナー-ドウドロフ経路などで用いられている電子伝達体です。化学式:C21H21N7O17P3、分子量:744.4。ニコチンアミドアデニンジヌクレオチドと構造上良く似ており、脱水素酵素の補酵素として一般的に機能しています。略号であるNADP+(あるいはNADP)として一般的にはよく知られています。酸化型(NADP+)および還元型(NADPH)の2つの状態を有し、二電子還元を受けるが中間型(一電子還元型)は存在しません。
    • テトラヒドロ葉酸(tetrahydrofolic acid)
      葉酸誘導体の1つです。ヒトでは、ジヒドロ葉酸レダクターゼ(EC 1.5.1.3)によってジヒドロ葉酸から合成されます。テトラヒドロ葉酸は多くの反応、特にアミノ酸と核酸の代謝に関わる補酵素です。
    • 補酵素(coenzyme)
      酵素反応の化学基の授受に機能する低分子量の有機化合物です。コエンザイム、コエンチーム、助酵素などともよばれます。補酵素の多くはビタミンとしてよく知られており、生物の生育に関する必須成分(栄養素)としてよく知られています。
    • アミノ酸(amino acid)
      広義には、アミノ基とカルボキシ基の両方の官能基を持つ有機化合物の総称です。狭義には、生体のタンパク質の構成ユニットとなる「α-アミノ酸」のことを指します。α-アミノ酸は、カルボキシ基が結合している炭素(α炭素)にアミノ基も結合しているアミノ酸であり、RCH(NH2)COOH という構造をもちます。このうちRに相当する部分は側鎖とよばれます。
    • 核酸(nucleic acid)
      リボ核酸 (RNA)とデオキシリボ核酸 (DNA)の総称で、塩基と糖、リン酸からなるヌクレオチドがホスホジエステル結合で連なった生体高分子のことです。
    • Modeller
      比較モデリングを行う代表的なソフトウェアです。政府系研究機関、商用利用は有料です。
    • キイロショウジョウバエ(Drosophila melanogaster)
      ハエ目(双翅目)・ショウジョウバエ科の昆虫です。生物学の様々な分野でモデル生物として用いられ、多くの発見がなされています。特に遺伝学的解析に優れた性質をもっています。単にショウジョウバエといえば本種を指すことも多いです。

4.11 複合体構造予測

  • 生体高分子(biopolymers)
    生物の細胞が作り出す天然の高分子のことであり、モノマー単位が共有結合して構成された大きな分子です。
  • 相互作用(interaction)
    この場合はタンパク質と他の分子の間にはたらく、共有結合ほど強くないもの(または力)のことです。分子どうしの間の相互作用は分子間相互作用ですし、イオンどうしの相互作用はイオン間相互作用です。
  • 立体構造(tertiary structure)
    リンク先は「三次構造」です。タンパク質やその他の高分子が取る三次元構造のことであり、その空間配置は原子座標によって定義されます。
  • 複合体(complex)
    この場合は、複数のタンパク質単体が1つの塊となって(機能して)いる状態や、タンパク質と低分子化合物が1つの塊となって(機能して)いる状態の形(立体構造)のことを指します。
  • 鋳型(template)
    この場合は、比較モデリングを実行するにあたり、参考にする構造既知のタンパク質のことです。
  • モデリング
    リンク先は「タンパク質構造予測」です。この場合は、「比較モデリング」のことです。立体構造未知のタンパク質の立体構造を予測する問題において、既に立体構造が解明されている相同なタンパク質が存在する場合は、その既知構造と似ているはずだという考えに立脚した構造予測法です。ホモロジーモデリングともよばれます。
  • 例題4.3
    1ページ目が問題、2ページ目以降が解答例です。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 低分子化合物(small molecule compound)
    分子量の小さい化合物のことです。分子量が1万以下のものを指すことが多いようです。
  • Modeller
    比較モデリングを行う代表的なソフトウェアです。政府系研究機関、商用利用は有料です。
  • ポリペプチド鎖(polypeptide chain)
    実質的にタンパク質の一次構造と同じ意味です。

  • 複合体(complex)
    この場合は、複数のタンパク質単体が1つの塊となって(機能して)いる状態や、タンパク質と低分子化合物が1つの塊となって(機能して)いる状態の形(立体構造)のことを指します。
  • ドッキングシミュレーション(docking simulation)
    リンク先は「ドッキング (分子)」です。ドッキングさせたい2つの分子(大きい方を受容体、小さい方をリガンドと呼ぶ)があったときに、リガンドの受容体への収まりのよい立体配座(コンフォメーション)を、結合自由エネルギーが最も小さくなる複合体構造探索問題として実行する作業のことを指します。
  • 受容体(receptor)
    この場合は、ドッキングする2つの分子のうち、サイズが大きい方の分子のことです。
  • リガンド(ligand)
    この場合は、ドッキングする2つの分子のうち、サイズが小さい方の分子のことです。生体分子と複合体を形成して生物学的な目的を果たす物質のことです。 タンパク質-リガンド結合では、リガンドは通常、標的タンパク質上の結合部位に結合することでシグナルを生成する分子のことです。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 低分子化合物(small molecule compound)
    分子量の小さい化合物のことです。分子量が1万以下のものを指すことが多いようです。
  • 自由エネルギー(free energy)
    熱力学における状態量の1つであり、化学変化を含めた熱力学的系の等温過程において、系の最大仕事(潜在的な仕事能力)、自発的変化の方向、平衡条件などを表す指標です。
  • 結合自由エネルギー
    複合体形成による自由エネルギー変化のことです。受容体とリガンドが結合するとエネルギーが変化するので、この値を計算すれば受容体とリガンドの結合の強さがわかるのです。
  • 平衡定数(equilibrium constant)
    化学反応の平衡状態を、物質の存在比で表したものです。解離定数の逆数です。
  • 解離定数(dissociation constant)
    複合体がその構成分子へとばらばらになる時、あるいは塩がその構成イオンへと分かれる時に、より大きな方の対象物がより小さな構成要素へと可逆的に分離(解離)する傾向を測る特殊な平衡定数です。解離定数は結合定数の逆数です。

  • 受容体(receptor)
    この場合は、ドッキングする2つの分子のうち、サイズが大きい方の分子のことです。
  • リガンド(ligand)
    この場合は、ドッキングする2つの分子のうち、サイズが小さい方の分子のことです。生体分子と複合体を形成して生物学的な目的を果たす物質のことです。 タンパク質-リガンド結合では、リガンドは通常、標的タンパク質上の結合部位に結合することでシグナルを生成する分子のことです。
  • 解離定数(dissociation constant)
    複合体がその構成分子へとばらばらになる時、あるいは塩がその構成イオンへと分かれる時に、より大きな方の対象物がより小さな構成要素へと可逆的に分離(解離)する傾向を測る特殊な平衡定数です。解離定数は結合定数の逆数です。
  • 結合自由エネルギー
    複合体形成による自由エネルギー変化のことです。受容体とリガンドが結合するとエネルギーが変化するので、この値を計算すれば受容体とリガンドの結合の強さがわかるのです。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 低分子化合物(small molecule compound)
    分子量の小さい化合物のことです。分子量が1万以下のものを指すことが多いようです。
page142

4.11.1 タンパク質-タンパク質ドッキングシミュレーション

  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • ドッキングシミュレーション(docking simulation)
    リンク先は「ドッキング (分子)」です。ドッキングさせたい2つの分子(大きい方を受容体、小さい方をリガンドと呼ぶ)があったときに、リガンドの受容体への収まりのよい立体配座(コンフォメーション)を、結合自由エネルギーが最も小さくなる複合体構造探索問題として実行する作業のことを指します。
  • 剛体(rigid body)
    力の作用の下で変形しない物体のことです。
  • 自由度(degree of freedom)
    変数のうち独立に選べるものの数のことです。
  • 受容体(receptor)
    この場合は、ドッキングする2つの分子のうち、サイズが大きい方の分子のことです。
  • リガンド(ligand)
    この場合は、ドッキングする2つの分子のうち、サイズが小さい方の分子のことです。
  • 並進(translation)
    この場合は、(比較したい2つの立体構造のうちの)一方を全体として平行移動させて、もう一方の立体構造に全体として近づけていくことです。
  • 形の相補性
    アルフレート・ヴェーゲナー(Alfred Wegener)大陸移動説を思いついたきっかけとして、大西洋両岸の大陸の形状(特にアフリカと南アメリカ)が一致することを挙げていることと似たようなことを言っているのだと理解すればよいです。
  • Chen and Weng, Proetins, 2003
    タンパク質どうしのドッキングシミュレーションでは、形の相補性が特に重要であることを述べた論文です。
  • 溶媒露出表面積(accessible surface area; ASA)
    リンク先は「Accessible surface area」です。水分子などの溶媒と触れる生体分子(タンパク質)表面の面積のことです。
  • 表面原子
    溶媒露出表面積(ASA)が一定以上の原子のことです。
  • コア原子
    溶媒露出表面積(ASA)が一定未満の原子のことです。水溶性タンパク質のコア(中心)部分にあるものは、必然的に溶媒と触れる確率が低いのでコア原子になりやすいと解釈すればよいです。
  • 受容体タンパク質
    ドッキングする2つの分子のうち、サイズが大きい方の分子(タンパク質)のことです。
  • 虚数(imaginary number)
    実数ではない複素数のことです。
  • 図4.20
    形の相補性の計算です。
  • リガンドタンパク質
    ドッキングする2つの分子のうち、サイズが小さい方の分子(タンパク質)のことです。
page143
  • 畳み込み(convolution)
    関数 g を平行移動しながら関数 f に重ね足し合わせる二項演算です。畳み込み積分、合成積、重畳積分、あるいは英語に倣いコンボリューションともよばれます。
  • 高速フーリエ変換(fast Fourier transform; FFT)
    離散フーリエ変換(discrete Fourier transform; DFT)を高速に計算するアルゴリズムです。ある信号をいくつかの周波数成分に分解し、それらの大きさをスペクトルとして表すことできます。

  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • ドッキングシミュレーション(docking simulation)
    リンク先は「ドッキング (分子)」です。ドッキングさせたい2つの分子(大きい方を受容体、小さい方をリガンドと呼ぶ)があったときに、リガンドの受容体への収まりのよい立体配座(コンフォメーション)を、結合自由エネルギーが最も小さくなる複合体構造探索問題として実行する作業のことを指します。
  • W4.8

    タンパク質-タンパク質のドッキングシミュレーションのためのソフトウェアとWebサイトです。HADDOCK*1は非商用利用のみです。HEX*2とZDOCK*2は非商用利用のみで、商用利用は別ライセンスです。

    名称 URL
    FTDock http://www.sbg.bio.ic.ac.uk/docking/ftdock.html
    GRAMM-X http://vakser.bioinformatics.ku.edu/resources/gramm/grammx
    HADDOCK*1 https://wenmr.science.uu.nl/haddock2.4/
    HEX*2 http://hex.loria.fr/
    ZDOCK*2 http://zlab.umassmed.edu/zdock/index.shtml

  • 図4.21
    β-lactamase(暗灰色)に対するβ-lactamase inhibitory protein(明灰色)のドッキング構造と複合体の結晶構造です。
  • 1ZG4
    β-lactamaseのPDBエントリです。
  • 3GMU β-lactamase inhibitory proteinのPDBエントリです。
  • 1JTG
    β-lactamase(1ZG4)とβ-lactamase inhibitory protein(3GMU)の複合体構造PDBエントリです。前者(1ZG4)のほうが大きいので受容体、後者(3GMU)がリガンドという位置づけになります。

4.11.2 タンパク質-低分子化合物ドッキングシミュレーション

  • 低分子化合物(small molecule compound)
    分子量の小さい化合物のことです。分子量が1万以下のものを指すことが多いようです。
  • タンパク質(protein)
    20種類のアミノ酸が鎖状に多数連結(重合)してできた高分子化合物であり、生物の重要な構成成分の1つです。連結したアミノ酸の個数が少ない場合にはペプチドといい、これが直線状に連なったものはポリペプチドとよばれます。
  • 自由度(degree of freedom)
    変数のうち独立に選べるものの数のことです。この場合は、動かせる関節部分がどれだけあるか?というイメージで捉えるとよいです。低分子化合物のほうが圧倒的にタンパク質よりも関節部分が少ないというのは直感的にわかると思います。
  • 並進(translation)
    この場合は、(比較したい2つの立体構造のうちの)一方を全体として平行移動させて、もう一方の立体構造に全体として近づけていくことです。
  • 二面角(dihedral angle)
    2つの平面(またはその部分集合)がなす角度である。たとえば、二面角が0なら2面は平行(同一の場合を含む)で、π/2 (つまり90度)なら垂直です。
  • 受容体(receptor)
    この場合は、ドッキングする2つの分子(タンパク質と低分子化合物)のうち、サイズが大きい方の分子(つまりタンパク質)のことです。
  • 剛体(rigid body)
    力の作用の下で変形しない物体のことです。
  • 酵素(enzyme)
    生体内外で起こる化学反応に対して触媒として機能する分子のことです。
  • 基質(substrate)
    リンク先は「基質 (化学)」です。化学反応において他の試薬と反応して生成物を作る化学種の1つです。
  • 阻害剤(inhibitor)
    リンク先は「酵素阻害剤」です。酵素などの分子に結合してその活性を低下または消失させる物質のことです。
  • 活性中心(active site)
    リンク先は「活性部位」です。基質が結合し化学反応が進む酵素の部位のことです。
  • W4.9

    タンパク質-低分子化合物のドッキングシミュレーションに有用なサイトです。*1学術利用は無料、商用利用は別ライセンスです。*2商用利用は有料です。*3有料です。

    名称 URL
    くぼみの検出
    GHECOM https://pdbj.org/ghecom
    PASS http://www.ccl.net/cca/software/UNIX/pass/overview.shtml
    SURFNET*1 http://www.ebi.ac.uk/thornton-srv/software/SURFNET/
    化合物ライブラリ
    DrugBank https://go.drugbank.com/
    PubChem https://pubchem.ncbi.nlm.nih.gov/
    ZINC http://zinc.docking.org/
    ドッキングソフトウェア
    AutoDock Vina http://vina.scripps.edu/
    DOCK*2 http://dock.compbio.ucsf.edu/
    Glide*3 https://www.schrodinger.com/products/glide
    GOLD*3 https://www.ccdc.cam.ac.uk/solutions/csd-discovery/Components/gold

  • 親和性
    ある物質が他の物質と容易に結合する性質や傾向のことです。
  • 結合自由エネルギー
    複合体形成による自由エネルギー変化のことです。受容体とリガンドが結合するとエネルギーが変化するので、この値を計算すれば受容体とリガンドの結合の強さがわかるのです。
  • スコア関数(score function)
    結合自由エネルギーを近似的に計算するための関数であり、W4.9にリストアップされているプログラムごとに独自のものが使われています。
  • AutoDock VinaTrott and Olson, J Comput Chem., 2010
  • van der Waals相互作用
    リンク先は「ファンデルワールス力」です。原子、イオン、分子の間に働く力(分子間力)の一種です。ファンデルワールス力によって分子間に形成される結合を、ファンデルワールス結合といいます。van der Waals力は、ヨハネス・ファン・デル・ワールスが実在気体の状態方程式を定式化した際に導入された凝縮力です。van der Waals相互作用は、これまでの説明部分で「力」を「相互作用」に置き換えたものだと解釈すればよいです。
  • 疎水性相互作用(hydrophobic interaction)
    リンク先は「疎水効果」です。水などの極性溶媒中で非極性分子(あるいは非極性基)が溶媒と分離し凝集する性質(これを疎水効果といいます)によって、非極性分子間に働く引力的相互作用のことです。簡単に言えば、疎水性分子どうしが水にはじかれ、集合する現象です。ラーメンの表面に浮かんでいる凝集した油をイメージすればよいでしょう。
  • 水素結合(hydrogen bond)
    電気陰性度が大きな原子(陰性原子)に共有結合で結びついた水素原子が、近傍に位置した窒素、酸素、硫黄、フッ素、π電子系などの孤立電子対とつくる非共有結合性の引力的相互作用です。水素結合には、異なる分子の間に働くもの(分子間力)と単一の分子の異なる部位の間(分子内)に働くものがあります。
  • Trott and Olson, J Comput Chem., 2010
    AutoDock Vinaの論文です。
  • エントロピー(entropy)
    熱力学および統計力学において定義される示量性の状態量です。熱力学において断熱条件下での不可逆性を表す指標として導入され、統計力学において系の微視的な「乱雑さ」を表す物理量という意味付けがなされました。エントロピーはエネルギーを温度で割った次元をもちます。

page144
  • 創薬(drug discovery)
    薬剤を発見したり設計したりするプロセスのことです。
  • 化合物(chemical compound)
    化学反応を経て2種類以上の元素が結合することによって生成する物質のことです。
  • 化合物のライブラリ
    W4.9では、以下の3つがリストアップされています。ここでのライブラリとは、既知の化合物の各種情報をまとめたデータベースのようなものだという理解でよいです。
  • ハイスループットスクリーニング(high-throughput screening; HTS)
    特に創薬で使用される、生物学および化学の分野に関連する科学実験の方法です。遺伝学的、化学的、薬理学的な何百万もの試験を迅速に実施することを可能にするシステム全体のようなイメージで捉えるとよいです。
  • ドッキングシミュレーション(docking simulation)
    リンク先は「ドッキング (分子)」です。ドッキングさせたい2つの分子(大きい方を受容体、小さい方をリガンドと呼ぶ)があったときに、リガンドの受容体への収まりのよい立体配座(コンフォメーション)を、結合自由エネルギーが最も小さくなる複合体構造探索問題として実行する作業のことを指します。
  • バーチャルスクリーニング(virtual screening)
    医薬品開発に用いられるコンピュータ技術の1つです。医薬品ターゲット(多くの場合、タンパク質受容体もしくは酵素)と最も良く結合する化学構造(化合物のこと)を特定するために、コンピュータを用いて高速に多数の構造を評価する一連の作業です。「非常に大きな化合物群(ライブラリ)を(コンピュータプログラムで)自動的に評価すること」とも定義されているようです。バーチャルスクリーニングとは、膨大な数の想定可能な化学物質をふるいにかけて、いかにして実際に合成、試験できる妥当な数に絞りこめるか、という点に注目する数のゲームのようなものです。
  • インシリコスクリーニング(in silico screening)
    上記のバーチャルスクリーニングと実質的に同じことを指します。「インシリコ(in silico)」は「コンピュータ上の作業」を意味しますので、HTSでの総実験数を減らす目的で、HTSの前段階で行われます。
  • スコア関数(score function)
    結合自由エネルギーを近似的に計算するための関数であり、W4.9にリストアップされているプログラムごとに独自のものが使われています。

コラム AlphaFoldの衝撃

第4章 演習問題