Bioinfomatics(タンパク質コンタクトマップ予想のためのDeep architectures)
以下に書いたものは、論文を基にした私の理解なので、正確性を欠きます。正確な情報を知りたい場合は、下記の論文を参照してください。また、下記の論文の図を参照することで、理解が深まると思います。
Deep architectures for protein contact map prediction
要約
- 残基間のコンタクトの予測はタンパク質の構造予測に重要である。
- 現在のコンタクトの予測は、長距離のコンタクトにおいてわずかに20%を超えるだけで、全原子の構造を予測するためには精度は少ない。
- 新しい機械学習の方法と3つのスッテプを使って、コンタクトマップ予測の精度を高めた。
- 1ステップ目では、2次元の再帰ニューラルネットワークを粗視化コンタクトマップと2次元構造間の向きを予測するために使用した。
- 2ステップ目では、2次元構造を配置するためにエネルギーベースの方法を使い、コンタクトしているアルファヘリックスとストランドのアミノ酸間のコンタクト確率を予測した。
- 3ステップ目では、重複のないタンパク質構造データセットを用いてdeep neural networkを使い、そして、ホモロガスではないドメインのセットとCASP8とCASP9で用いたタンパク質セットを用いてテストした。
- 長距離のコンタクトにおいて、CMAPpro predictorの精度は30%近く、存在する方法を優位に超えている。