原子位置の二乗平均平方根偏差

出典: フリー百科事典『ウィキペディア(Wikipedia)』
タンパク質・トリオースリン酸イソメラーゼの三次構造を表記方法を変えて表したもの。RMSDの計算では、これらに含まれる原子に座標を設定し、他のタンパク質の構造と比較する。

原子位置の二乗平均平方根偏差(げんしいちのにじょうへいきんへいほんこんへんさ、英語: root-mean-square deviation of atomic positions)とは、タンパク質あるいはその他の分子の構造同士の距離の二乗平均平方根であり、バイオインフォマティクスにおいてこれらの類似性を示す指標である。単に二乗平均平方根偏差 、英語の略記でRMSDとも。

概要[編集]

タンパク質・その他分子における原子位置の二乗平均平方根偏差 (RMSD) は[1]、重ね合わされたタンパク質の対応する二原子間の距離を二乗し、その相加平均平方根をとった値である[2]。このとき、主に計算に使用される原子はタンパク質主鎖の原子である。球状タンパク質の構造の研究では、通常、タンパク質同士で後述する最も適した重ね合わせを行い、アミノ酸の中心炭素原子に対して原子座標のRMSDをとることにより、三次元構造の類似性を比較する。

これらの比較には、並進回転によってRMSDを最小化するように構造を移動させる方法が広く用いられている。Coutsiasらは、四元数を用いて二組のベクトル間でRMSDを最小化する剛体変換を行う簡単な方法を導出し[3]、これらの方法がKabschアルゴリズム英語版と等価であることを証明した[4]。また、Kabschアルゴリズムで得られる解は、HurleyとCattellによって導入された、任意の次元の行列に対する特異値分解を用いた最小二乗法の解の一例となっている(プロクラステス解析英語版[5]。さらに、最適な回転を計算するための四元数の解がPetitjeanによって論文に掲載され[6]、この解と任意の次元での最適な等長写像の計算が無限集合連続の場合へと拡張された[7]

また、力学系が明確に定義された平均位置を中心にゆらぎを起こす場合、平均位置を基準としたずれをRMSF (root-mean-square fluctuation) という[8]

方程式[編集]

ただし、δi は座標変換された i 番目の原子と参照構造で対応する原子との距離である[9]。これは、たびたび炭素酸素窒素といったタンパク質主鎖での相対的に重い原子で計算され、Cα(アミノ酸中心炭素原子)のみで計算されることもある[10]

タンパク質が並進・回転移動を経てRMSDを最小化する最も適した重ね合わせが得られると、この最小値が値として用いられる。 個の二組のベクトル が与えられると、RMSDは以下のようにも表される。

RMSDは長さの単位で表され[9]、最も多く用いられている単位はオングストローム (Å) である。

応用[編集]

溶媒中でのシトクロムcの運動状態をシミュレーションしたもの

代表的なRMSDの用途は、複数のタンパク質構造定量的な評価である。タンパク質構造予測精密評価は、提出された構造と既知の構造との類似度を評価する指標の一つとしてRMSDを用いている。このとき、RMSDの値が小さいほど、提出された構造は目的の構造に近く、より良いものとなる。

また、タンパク質フォールディングをコンピュータによってシミュレーションする研究では(分子動力学法)、タンパク質がどの程度折り畳まれた状態かを定量化するための反応座標としてRMSDが使用されることがある。

さらに、タンパク質などの高分子にリガンドとして結合する有機小分子に対するRMSDの研究も、ドッキングという点から一般的である[1]。ただし、リガンドの場合はタンパク質とは異なり、ふつうRMSDの計算前には構造の重ね合わせは行われない。

RMSDは、タンパク質進化における類似性やシーケンスアラインメントの性質を定量化するために提案されている指標の一つである[11] [12]

関連項目[編集]

脚注[編集]

注釈[編集]

出典[編集]

  1. ^ a b Molecular docking, estimating free energies of binding, and AutoDock's semi-empirical force field” (英語). Sebastian Raschka's Website (2014年6月26日). 2016年6月7日閲覧。
  2. ^ RMSD”. Protein Data Bank Japan. 2021年5月4日閲覧。
  3. ^ “Using quaternions to calculate RMSD”. J Comput Chem 25 (15): 1849–1857. (2004). doi:10.1002/jcc.20110. PMID 15376254. 
  4. ^ Kabsch W (1976). “A solution for the best rotation to relate two sets of vectors”. Acta Crystallographica 32 (5): 922–923. Bibcode1976AcCrA..32..922K. doi:10.1107/S0567739476001873. 
  5. ^ “The Procrustes Program: Producing direct rotation to test a hypothesized factor structure”. Behavioral Science 7 (2): 258–262. (1962). doi:10.1002/bs.3830070216. 
  6. ^ Petitjean M (1999). “On the Root Mean Square quantitative chirality and quantitative symmetry measures”. Journal of Mathematical Physics 40 (9): 4587–4595. Bibcode1999JMP....40.4587P. doi:10.1063/1.532988. https://hal.archives-ouvertes.fr/hal-02122820/file/PMP.JMP_1999.pdf. 
  7. ^ Petitjean M (2002). “Chiral mixtures”. Journal of Mathematical Physics 43 (8): 185–192. Bibcode2002JMP....43.4147P. doi:10.1063/1.1484559. https://hal.archives-ouvertes.fr/hal-02122882/file/PMP.JMP_2002.pdf. 
  8. ^ 古明寺勇人; 上林正巳; 長嶋雲兵 (2000). “生体分子の分子動力学シミュレーション (1)方法”. Journal of Chemical Software 6 (1): 1-36. doi:10.2477/jchemsoft.6.1. 
  9. ^ a b 藤博幸『よくわかるバイオインフォマティクス入門』講談社、2018年11月、247頁。ISBN 9784065138212 
  10. ^ シンシア・ギバス; パー・ジャンベック 著、水嶋洋 訳『実践バイオインフォマティクス ゲノム研究のためのコンピュータスキル』オライリー・ジャパン、2002年、42頁。ISBN 4873110688 
  11. ^ Jewett AI, Huang CC, Ferrin TE (2003). “MINRMS: an efficient algorithm for determining protein structure similarity using root-mean-squared-distance”. Bioinformatics 19 (5): 625–634. doi:10.1093/bioinformatics/btg035. PMID 12651721. https://academic.oup.com/bioinformatics/article-pdf/19/5/625/657994/btg035.pdf. 
  12. ^ “The iRMSD: a local measure of sequence alignment accuracy using structural information”. Bioinformatics 22 (14): e35–39. (2006). doi:10.1093/bioinformatics/btl218. PMID 16873492. https://academic.oup.com/bioinformatics/article-pdf/22/14/e35/615011/btl218.pdf. 

外部リンク[編集]