生物の分子構造及び動力学に対するコンピュータシミュレーションの方法及び応用
2010年 5月17日
劉海燕:中国科学技術大学生命科学学院 教授
1969年1月生まれ。1996年中国科学技術大学生物化学及び分子生物学理学博士、スイスチューリヒ高等理工学院(ETH)物理化学実験室、米国デューク大学化学学部、米国ノースカロライナ大学教会山分校生物物理及び生物化学部等でポスドク、客員科学者等。中国科学院"百人計画"、国家自然科学基金委員会"傑出青年基金"等の援助を取得。主に生物大分子コンピュータシミュレーション、タンパク質の設計と応用等の研究に従事。既発表の学術論文数は五十余篇。
1. 生物の分子構造及び動力学の研究にとってのコンピュータシミュレーションの意義
生物巨大分子動力学とは分子の三次元構造が生じる可能性のある経時的な動態変化を指す。多くの情況下では、生物分子の機能はその静態構造によって決定づけられるだけでなく、その構造の動力学的変化によっても決定づけられる。生物の分子構造、動力学と機能の関係を解析すれば、生命活動における重要なプロセスのミクロのメカニズムについての理解を深めることができるだけでなく、生物分子の性質の最適化、機能改造及び生物分子をターゲットにした薬物設計等に対しても指導的な役割を果たすことができる。生物の分子構造と動力学の解析は、実験による解析とコンピュータシミュレーションの二種類の手段を用いることができる。
現在、実験手段で測定できる生物分子の観察可能な測定に含まれる構造及び動力学の情報は非常に重要であるが、タイプが限定される。生物の分子構造の実験情報は主に結晶回折とMRIから得ているもので、少数は円二色性、赤外線及びラマンスペクトル等から得ている。これらの実験が提供する観察可能な測定が受ける最も重要な制限とは、即ちそれらが時間或いは空間上での大量の分子に対する平均であることである。例えば、結晶回折は結晶中のすべての分子内の各原子の平均の位置を提供するが、原子の位置の時空分布(即ち分子の空間構造の経時的変化、および空間位置の異なる同種分子の構造間の差異)を反映することはできない。
コンピュータシミュレーションは実験による研究の上記の不足を補うことができる。分子動力学(molecular dynamics、MD)シミュレーションを例に挙げる。分子動力学シミュレーションの軌跡から、我々は理論上定義できるあらゆる観察可能な或いは観察不能な量の平均値を得ることができるだけでなく、またこれらの量の時間配列及び特定の熱力学状態下の分布を得ることができる。例えば、分子のあり得る異なる立体配座の状態及びその分布、分子中の異なる部分間の相互作用の立体配座に対する依存関係及びその分布等である。
コンピュータシミュレーションのもう一つの利点は理論モデルにおけるあらゆるパラメーターの制御も可能なことである。理論モデルのパラメーターを順次変えることによって、そのシミュレーション結果に対する影響を解析すれば、因果関係の厳密性に供することができる。それに相応する一連の解析は実験による研究においてはしばしば実現が不可能である。例えば、実験では体系のある種の性質だけを変えてその他の実験パラメーターには影響を与えないようにすることは非常に難しい、或いは研究目的に基づいて思うように任意の実験パラメーターを変えるとしても、ミクロの物理的相互作用に対する制御は不可能である。
コンピュータシミュレーションによって、我々は生物の分子構造と動力学の下層にある要素、即ち立体配座、エネルギー、エントロピー、駆動力等の決定について、その熱力学分布と時間配列等の取得を含めた理論上の定量解析をすることによって、実験観察データについて理性的な解釈を行うことができる。例えば予想外の理論予測の結果を得た場合、また新しい実験を設計して検証することが可能である;一定の条件の下では、理論シミュレーションの結果の精度は実験に到達或いは超える可能性があるので、実験を代替することができる;実験の構築或いは測定の前の、理論の設計と予測には応用価値のある分子体系があり、知的財産権を確立する。
2. コンピュータシミュレーションの基本原理
生物分子のコンピュータシミュレーションの方法は二つの最も基本的な要素から構成されている。一つの要素は生物分子体系のエネルギーモデル、即ち数学形式で表されるもので、分子体系のエネルギーは分子の立体配座に伴って変化する物理或いは統計モデルで、V(R)と略記することができる。そのうちVは総ポテンシャルエネルギーを表し、Rは分子の立体配座を表す。二つ目の要素はエネルギーモデルの指導下での分子のあり得る立体配座に対する試料の採取方法である、即ち一連の立体配座{R1、R2、...RN}を分子体系の立体配座の特定時空分布の代表試料とする。例えば、最もよく見られる状態は試料が熱力学の平衡分布を表していることを示す。即ち体系の立体配座の分布はボルツマン分布に従い、体系はミクロ状態[R、R+dR]の確率p(R)dR exp[-V(R)/ kBT]dRにあり,ここでkBはボルツマン常数で、Tは環境温度である。
MDは最もよく使われる熱力学の平衡分布の試料採取方法の一つである。そのプロセスは数値の解を求める体系がポテンシャルエネルギーV(R)の下の古典的ニュートンの運動方程式にあり、Rの時間変化の軌跡R(t)を取得する。もしシミュレーションされる変化時間が十分に長ければ、異なる時点における体系の立体配座は熱力学の平衡分布の試料を構成している。熱力学分布の試料を提供するほかに、MDは立体配座の経時的な連続変化の軌跡も提供している。
3. 生物分子のコンピュータシミュレーションにおける方法学の問題
エネルギーモデルの精度と立体配座の空間に対する試料採取の範囲はコンピュータシミュレーションの質を決定する二つの重要な要素であり、コンピュータシミュレーションの実際問題における応用価値を決定づけている。
MDでは一般的に分子力学の磁場のエネルギーモデルを使用する。生物分子の磁場の長い時間変化の中で、小分子体系の構造、熱力学データはエネルギー関数形式とパラメーターを確定する最も重要な根拠とされてきた。計算能力、実験データ、定量指標等の制限を受けて、分子の磁場が描写する巨大分子の構造、動力学の正確性は往々にして最も基本的なテストシミュレーションのみによって定性検査が行われ、立体配座の平衡自由エネルギー等の定量要素は考慮されない。近年、計算能力の急速な向上に伴って、現在の生物分子の磁場の正確度不足の問題は日増しに明らかになってきている。ポリペプチドの異なる二級構造の立体配座間の平衡を例に挙げる。同一体系に対して異なる磁場を使用する場合は往々にして結果は不一致となる。しかし同一の磁場を使用して異なる体系をシミュレーションすると、結果と実験の一致度合いも非常に大きな差異を示す可能性がある。磁場の精度不足は分子シミュレーションの構造生物学における広範な応用を制限する主要なボトルネックであると思われる。
ひとたびシミュレーション結果と実験観察の比較によってモデル或いは磁場の信頼性が確立された場合、すぐに実験が測定できない分子の性質を予測して、分子設計を行う有力なツールとすることができる。コンピュータシミュレーションはすでに構造修正、構造予測、分子設計等に広範に応用されている。しかし、現在コンピュータの計算能力の制限を受け、分子動力学シミュレーションを用いて研究できる生物の分子体系の大きさの上限は数十万個の原子で、シミュレーションの過程での時間のスパンは数十~数百nsである。非常に多くの重要な生物のプロセスについて言えば、この時間と空間の規模では分子体系の試料採取の範囲は依然として限界がある。コンピュータシミュレーションが実験従事者にとってよりいっそう役に立つツールとなるためには、シミュレーションできる体系の時間と空間の規模を出来るだけ大きくする必要がある。時間尺度においてはシミュレーションがカバーできる物理的時間の範囲は特定の問題と関係ある真実の分子運動が必要とする時間をはるかに上回るようにしなければならない。空間尺度においては興味あるプロセスに対して影響のある各種の環境要素を出来るだけシミュレーション体系の中に含めるようにすることである。
コンピュータシミュレーションの時空尺度の増加については以下の幾つかの方法がある。一つはスピードがより速い、並行規模がより大きい、効率がより高いコンピュータを使用し、同じ計算時間を費やせば、シミュレーションがカバーする分子運動の時間はより長くなる。これは主により先進的なコンピュータハードの使用、より高効率の計算方法特に並列計算法等の開発に依存する方法である。二は試料採取計算の増強方法の使用で、同様の計算量を費やして、より大きな範囲の立体配座の変化に対して試料採取を行う。これは例えば副本交換動力学シミュレーション等のように一部の一定の普遍性を持つ計算方法を含むだけでなく、例えば特定の初期状態と終止状態の立体配座間の変化の経路の研究に用いるターゲット動力学シミュレーション等に用いる一部の特定の問題に焦点を合わせた特殊な方法も含む。三は異なるレベルで"粗粒化"を用いるシミュレーション技術である。粗粒化モデルでは、シミュレーションされる体系の各"粒子"は真実の体系の中の一組の原子を代表し、体系の自由度が減ると、シミュレーションの各ステップの計算量が減少する。同時に粗粒化体系のエネルギー曲面はより平滑になり、より長い積分のステップを使用することができる。全体的に言えば、計算量は変わらずに、粗粒化モデルはシミュレーションがカバーする時間尺度を数レベル上まで高めることができる。
4. 中国の一部の研究機関が展開している生物分子コンピュータシミュレーションの研究
コンピュータソフト及びハードの普及に伴って、多くの重点大学、中国科学院傘下の研究所等には、コンピュータシミュレーションを主な手段にして生物の巨大分子構造と動力学の研究を行っている研究者たちがいる。関連の課題グループは生物学、化学、物理、薬物設計等多くの学科に分布している。
生物学の学科では、筆者が所属する中国科学技術大学計算生物学研究グループが前世紀90年代の初めからタンパク質の分子動力学シミュレーションの研究を始めている。我々の研究は主に分子体系の自由エネルギーの計算方法、立体配座の試料採取方法、酵素触媒プロセスにおける量子力学―分子力学の結合シミュレーションの方法等に集中している。2001-2005年の期間では以下の研究を行った。エネルギー関数方面では、GROMOS分子力学エネルギー関数との結合、半経験緊密束縛密度汎関数モデルと結合した広義のボーン溶剤化モデルのパラメーター化を完成し、そしてGROMOS/GBSAモデルがタンパク質の正/誤フォールディング立体配座を区分する能力を検証した。試料採取方法の研究では、粗粒化したフレキシブルネットワーク動力学モデルと原子レベルの分子動力学シミュレーションの方法を結合して、集合運動の拡大(ACM)シミュレーションの方法を発展させ、そして卵白構造域間の運動及びミニペプタイドフォールディングプロセスに対するシミュレーションによって検証を行った。ACM方法と分布式計算の結合は卵白構造域BdpAの物理的ポテンシャルエネルギー面上での連続フォールディング経路の試料採取を実現し、経路上の移行状態構造と当該卵白のフォールディングプロセスのphi-値に対する実験解析との間には高い相関がある。また計算とシミュレーションの方法を用いて圧力強度/温度のGB1構造域のフォールディング行動メカニズムに対する調節作用を研究し、そして低pH下の人由来のprP卵白の立体配座転換の初期経路の研究を行った。
我々の2006-2009年における研究は二つの方面である。一つは一次性原理に基づく酵素触媒プロセスの方法の発展と応用をシミュレーションすることであった。二はタンパク質の一部の立体配座の配列に対する依存関係、及びそれがどのように物理的化学的環境の調節を受けているかをより正確に描写することによって、現在巨大分子のシミュレーションに用いている計算シミュレーションを改善しようと試みた。第一の方面では、ある反応経路の最適化方法を改善し、それが巨大分子体系の経路の最適化問題に適用できるようにした。そしてそれを金属の加水分解酵素の異なる金属イオンの愛好性の源泉及びセリンの脱水素酵素の触媒メカニズムの研究に応用している。第二の方面では、ポリペプチドの溶液中の立体配座の平衡定量計算における傘型試料採取方法の自主適応の改善及び発展で、溶液中の立体配座の平衡に対する定量シミュレーションを実現した。定量計算する立体配座平衡の自由エネルギー面と量子力学の結果を比較して、分子の磁場の主鎖二面角に依存するエネルギー項を改善し、シミュレーションの結果分子力学モデルがタンパク質の一部の構造に対する描写を改善することによって、タンパク質の天然構造に対するシミュレーションの結果を改善することができることを証明した。自由エネルギー摂動理論に基づきポリペプチドの立体配座平衡とその他の参考データの結合を分子の磁場のパラメーター化の根拠とする新しい方法を提出した。また一部の構造字母表に基づく一部の配列-一部の構造統計エネルギーを樹立し、当該ポテンシャルエネルギー関数が天然卵白の一部の構造と配列間の依存関係をうまく定量化できることを証明した。
筆者の知るところでは、生物学界でその他に比較的長く分子シミュレーションの研究を行っている研究機関は以下である。北京工業大学生命学院は長期にわたりタンパク質複合物構造予測の分子シミュレーションの方法研究を行っている、そして何度もタンパク質複合物構造予測コンテスト(CAPRI)に参加している。中国科学院上海薬物研究所は分子シミュレーションを薬物関連卵白の構造と動力学の研究に応用し、特に卵白と卵白の相互作用、澱粉試料の凝集が招く疾患卵白の協同メカニズム等、そして薬物設計との結合である。
物理学の分野では、比較的早く生物分子のシミュレーションを行ったのは南京大学物理学部、中国科学院理論物理所、復旦大学、華中科学技術大学物理学部等の関連研究グループである。南京大学の王煒等は近年主に統計力学理論に基づく全原子シミュレーションを用いてタンパク質のフォールディングのメカニズムを解析している。彼らは系統的に多数の種類の"自由エネルギーの積み上げのない"フォールディング特性卵白、二元重合体フォールディング卵白及び金属卵白等を持つフォールディング経路のシミュレーションを展開し、理論面からフォールディングの自由エネルギー面とタンパク質三次元構造の位相特性の関係を解析した。復旦大学の丁関紅等は分子動力学シミュレーションの方法を用いて溶液中のポリペプチドが凝集する熱力学と動力学を研究している。彼らはまた炭素ナノパイプ等のナノ材料とポリペプチド間の相互作用を研究し、両者の溶液中の空間構造の自主組織現象のシミュレーションを行った。華中科学技術大学物理学部は分子の磁場を用いてタンパク質の熱安定性と配列の関係法則を解析した。中国科学院理論物理所の関連研究グループは現在タンパク質シミュレーションの粗粒化モデルの発展を行っている最中である。
近年、中国の各研究機関では絶えず新しい研究グループが設立され、生物分子のコンピュータシミュレーションの研究が行われている。中国科学院大連化学物理研究所の李国輝などは粗粒化モデルの発展、タンパク質の相互作用のシミュレーション等の研究を行っている。中国科学院北京遺伝子研究所の雷紅星等は連続媒体と分子の磁場の結合モデルの最適化、タンパク質構造域の最初からのフォールディングシミュレーション等の問題に関心を持っている。中国科学院系統所の盧本卓の課題グループは主にタンパク質の静電気モデル及び関連の数値の方法に関心を持ち、それを基質分子とタンパク質の結合、イオンの輸送等のプロセスのコンピュータシミュレーションに応用している。これらの課題グループの責任者は2007-2009年に相前後して中国科学院人材導入計画"百人計画"の支持を獲得している。