おいも貴婦人ブログ

生物系博士課程満期退学をしたAIエンジニアのブログ。

ProDyを使ってみよう!!!

ProDy — Protein Dynamics and Sequence Analysis
ProDyとは、オープンソースのタンパク質の構造的なダイナミクスを解析するパッケージです。(直訳気味)
ここでは、ProDyの簡単な使い方を紹介したいと思います。

早速インストール
pip install prody

pipでインストールできるなんて、スバラです!!!

pdbの読み込み
#! /usr/bin/env python
import prody

pdb=prody.parsePDB('model1z14.pdb')
frompdb=prody.parsePDB('1z14')
pdb2=proby.fetchPDB('1z14',compressed=False)   #未圧縮状態で保存
proby.pathPDBFolder('/home/user/Downloads')    #pdbの保存先の指定

スクリプトと同じディレクトリ内に、model1z14.pdbがあるときは、ファイル名を指定するだけで読み込んでくれます。pdbIDのみを指定すると、データベースからダウンロードしてきてくれます。

読み込んだpdbの情報をゲット
#! /usr/bin/env python
import prody

pdb=prody.parsePDB('model1z14.pdb')
print pdb.numAtoms()
print pdb.numCoordsets() # returns number of models
print pdb.numResidues()  # water molecules also count as residues
print pdb.getCoords()    # 原子の座標情報をGET
print pdb['A',100]       # model Aの100残基目の情報を表示
読み込んだpdbを解析してみよう。
#! /usr/bin/env python
import prody

pdb=prody.parsePDB('model1z14.pdb')
calcGyradius(pdb)        # 慣性半径

他にも

calcADPAxes          calcCrossProjection  calcMSF              calcRMSF
calcADPs             calcCumulOverlap     calcOccupancies      calcRankorder
calcANM              calcDeformVector     calcOmega            calcShannonEntropy
calcAngle            calcDihedral         calcOverlap          calcSqFlucts
calcCenter           calcDistance         calcPerturbResponse  calcSubspaceOverlap
calcCollectivity     calcFractVariance    calcPhi              calcTempFactors
calcCovOverlap       calcGNM              calcProjection       calcTransformation
calcCovariance       calcGyradius         calcPsi
calcCrossCorr        calcMSAOccupancy     calcRMSD

みたいなことが出来るみたい。

コマンドライン上でできること
prody align 1p38 1r39 1zz2

ダウンロードしてきて、さらに重ね合わせ。
さらに、基準振動解析もコマンドライン上からできるようです。
ここまで、紹介したのですが、まだまだ出来ることが多いようで紹介しきれません。
てことで、チュートリアルのリンクを貼りますので詳しく知りたい方は下記へ。
ProDy Tutorial — ProDy

PDBファイルへの書き出し

Cα原子のみ書き出してみる場合。

#! /usr/bin/env python
import prody

pdb=prody.parsePDB('model1z14.pdb')
writePDB('1z14calpha.pdb',pdb.select('calpha'))