

ドキュメント|論文|チュートリアル|インストール
タンパク質およびインタラクトミックグラフライブラリ
このパッケージは、タンパク質およびRNA構造の幾何学的表現、および生物学的相互作用ネットワークを生成するための機能を提供します。標準のPydata形式と互換性を提供し、人気のあるディープラーニングライブラリで使いやすいように設計されたグラフオブジェクトを提供します。
| 1.7.0 | foldcompデータセット | |
| 1.7.0 | PDBからデータセットを作成します | |
| 1.6.0 | タンパク質テンソルモジュール | |
| 1.5.0 | Alphafold2からのタンパク質グラフの作成! | |
| 1.5.0 | ドットブラケット表記からのRNAグラフ構造 | |
| 1.4.0 | 分子グラフの構築 | |
| 1.3.0 | Pytorchの幾何学のためのすぐに投げやすいデータローダー | |
| 1.2.0 | タンパク質グラフからサブグラフを抽出します | |
| 1.2.0 | タンパク質グラフ分析 | |
| 1.2.0 | グラフインCLI | |
| 1.2.0 | タンパク質グラフの視覚化! | |
| 1.1.0 | タンパク質 - タンパク質相互作用ネットワークのサポートと構造的相互作用(Alphafold2を使用!) | |
| 1.0.0 | 大規模な柔軟性のための高レベルおよび低レベルのAPI-独自のオーダーメイドのワークフローを作成してください! |
Grapheinは、プログラマティックAPIとグラフを構築するためのコマンドラインインターフェイスの両方を提供します。
グラフイン構成は、コマンドラインからグラフをバッチにバッチするために.yamlファイルとして指定できます。
ドキュメント
graphein -c config.yaml -p path/to/pdbs -o path/to/output| チュートリアル(残留レベル) | チュートリアル(アトミック) | ドキュメント |
from graphein . protein . config import ProteinGraphConfig
from graphein . protein . graphs import construct_graph
config = ProteinGraphConfig ()
g = construct_graph ( config = config , pdb_code = "3eiy" )| チュートリアル | ドキュメント |
from graphein . protein . config import ProteinGraphConfig
from graphein . protein . graphs import construct_graph
from graphein . protein . utils import download_alphafold_structure
config = ProteinGraphConfig ()
fp = download_alphafold_structure ( "Q5VSL9" , aligned_score = False )
g = construct_graph ( config = config , path = fp )| チュートリアル | ドキュメント |
from graphein . protein . config import ProteinMeshConfig
from graphein . protein . meshes import create_mesh
verts , faces , aux = create_mesh ( pdb_code = "3eiy" , config = config )グラフインは、スマイル文字列から分子グラフを作成し.sdf 、 .mol2 、および.pdbファイルを作成できます
| チュートリアル | ドキュメント |
from graphein . molecule . config import MoleculeGraphConfig
from graphein . molecule . graphs import construct_graph
g = create_graph ( smiles = "CC(=O)OC1=CC=CC=C1C(=O)O" , config = config )| チュートリアル | ドキュメント |
from graphein . rna . graphs import construct_rna_graph
# Build the graph from a dotbracket & optional sequence
rna = construct_rna_graph ( dotbracket = '..(((((..(((...)))..)))))...' ,
sequence = 'UUGGAGUACACAACCUGUACACUCUUUC' )| チュートリアル | ドキュメント |
from graphein . ppi . config import PPIGraphConfig
from graphein . ppi . graphs import compute_ppi_graph
from graphein . ppi . edges import add_string_edges , add_biogrid_edges
config = PPIGraphConfig ()
protein_list = [ "CDC42" , "CDK1" , "KIF23" , "PLK1" , "RAC2" , "RACGAP1" , "RHOA" , "RHOB" ]
g = compute_ppi_graph ( config = config ,
protein_list = protein_list ,
edge_construction_funcs = [ add_string_edges , add_biogrid_edges ]
)| チュートリアル | ドキュメント |
from graphein . grn . config import GRNGraphConfig
from graphein . grn . graphs import compute_grn_graph
from graphein . grn . edges import add_regnetwork_edges , add_trrust_edges
config = GRNGraphConfig ()
gene_list = [ "AATF" , "MYC" , "USF1" , "SP1" , "TP53" , "DUSP1" ]
g = compute_grn_graph (
gene_list = gene_list ,
edge_construction_funcs = [
partial ( add_trrust_edges , trrust_filtering_funcs = config . trrust_config . filtering_functions ),
partial ( add_regnetwork_edges , regnetwork_filtering_funcs = config . regnetwork_config . filtering_functions ),
],
)最もシンプルなインストールはPIP経由です。 NBこれは、データ形式への変換やPytorch 3Dでタンパク質構造メッシュの生成に必要なML/DLライブラリをインストールしません。詳細
pip install graphein # For base install
pip install graphein[extras] # For additional featurisation dependencies
pip install graphein[dev] # For dev dependencies
pip install graphein[all] # To get the lotただし、PYPIを介して利用できない多くの(オプションの)ユーティリティ(DSSP、Pymol、GetContacts)があります。
conda install -c salilab dssp # Required for computing secondary structural features
conda install -c schrodinger pymol # Required for PyMol visualisations & mesh generation
# GetContacts - used as an alternative way to compute intramolecular interactions
conda install -c conda-forge vmd-python
git clone https://github.com/getcontacts/getcontacts
# Add folder to PATH
echo "export PATH=$PATH:`pwd`/getcontacts" >> ~/.bashrc
source ~/.bashrc
To test the installation, run:
cd getcontacts/example/5xnd
get_dynamic_contacts.py --topology 5xnd_topology.pdb
--trajectory 5xnd_trajectory.dcd
--itypes hb
--output 5xnd_hbonds.tsv
開発環境には、グラフインに統合された各深い学習ライブラリのGPUビルド(CUDA 11.1)が含まれます。
git clone https://www.github.com/a-r-j/graphein
cd graphein
conda env create -f environment-dev.yml
pip install -e .より軽いインストールを次のように実行できます。
git clone https://www.github.com/a-r-j/graphein
cd graphein
conda env create -f environment.yml
pip install -e . CPU( docker-compose.cpu.yml )とGPU使用( docker-compose.yml )にローカルに2つのdocker-composeファイルを提供します。 GPUの使用については、nvidiaコンテナツールキットがインストールされていることを確認してください。コンテナに入った後、ローカルに取り付けられたボリュームを取り付けることを確認してください( pip install -e . )。これにより、開発環境もローカルにセットアップされます。
ビルド(GPU)実行:
docker-compose up -d --build # start the container
docker-compose down # stop the container
グラフインがあなたの仕事に役立つことが証明されている場合は、引用してください。
@inproceedings { jamasb2022graphein ,
title = { Graphein - a Python Library for Geometric Deep Learning and Network Analysis on Biomolecular Structures and Interaction Networks } ,
author = { Arian Rokkum Jamasb and Ramon Vi{~n}as Torn{'e} and Eric J Ma and Yuanqi Du and Charles Harris and Kexin Huang and Dominic Hall and Pietro Lio and Tom Leon Blundell } ,
booktitle = { Advances in Neural Information Processing Systems } ,
editor = { Alice H. Oh and Alekh Agarwal and Danielle Belgrave and Kyunghyun Cho } ,
year = { 2022 } ,
url = { https://openreview.net/forum?id=9xRZlV6GfOX }
}