おいも貴婦人ブログ

生物系博士課程満期退学をしたAIエンジニアのブログ。

JCTC(CD法を使った一般的粗視化力場の有効なパラメータの推定)

以下に書いたものは、論文を基にした私の理解なので、正確性を欠きます。正確な情報を知りたい場合は、下記の論文を参照してください。また、下記の論文の図を参照することで、理解が深まると思います。

Efficient Parameter Estimation of Generalizable Coarse-Grained Protein Force Fields Using Contrastive Divergence: A Maximum Likelihood Approach

要約
  • 最尤法の最適化計画はパラメータ推論に使われている。
  • 尤度の対数の勾配に従って、反復的に対応するモデルパラメータに関して、観測された実験データの尤度を最大化する。
  • 観測されたデータとしてタンパク質のトレーニングセットの天然構造を使って、物理ベースの粗視化タンパク質モデル(室温で2次構造を安定化させるために郷モデルの項を含んでいる)を推定するために最尤法推定を採用した。
  • 機会学習の方法としてCD( Contrastive divergence )法を勾配が増加する方向を見積もるために使った。ここでは、タンパク質の大きなトレーニングセットを使うことを可能とする。
  • 前の仕事と違って、タンパク質のモデルの一般化は、トレーニングセットにないタンパク質やペプチドのフォールディングを観測できる。
  • 同じ力場で違うファンデルワールスポテンシャルの形を比較した。ひとつはhard cutoffポテンシャルで、もうひとつはLJポテンシャルを使い、ここでのファンデルワールスパラメータは、CHARMMやAMBERの力場から推測、採用した。
  • ペプチドやプロテインGのシミュレーションでは、推測したファンデルワールスパラメータとLJポテンシャルは、前の観測と一致しているhard cutoffポテンシャルより、性能が良かった。
  • ただ単にファンデルワールスパラメータを使用した場合は、性能が推測したパラメータより劣る。これは、モデルパラメータは一般的に違うエネルギー関数で使うことができないことを意味している。