PepGLADダウンロードPepGLADソースコードのダウンロード

Pepglad：幾何学的潜在拡散を備えたフルアトムペプチド設計

カバー

クイックリンク

設定
- 環境
- データセット
- 訓練されたウェイト
使用法
- ペプチド配列構造の共同設計
- ペプチド結合構造の予測
紙実験の複製
- CodeSign
- 結合立体構造生成
接触
参照

設定

環境

Conda環境は、構成env.yamlで構築できます。

conda env create -f env.yaml

コードは、CUDAバージョン11.7およびPytorchバージョン1.13.1でテストされています。

コードを実行する前に環境をアクティブにすることを忘れないでください。

conda activate PepGLAD

（オプション）ピロセッタ

ピロセッタは、生成されたペプチドの界面エネルギーを計算するために使用されます。あなたがそれに興味があるなら、ここの指示に従ってインストールしてください。

（オプション）データセット

これらのデータセットは、ベンチマークモデルにのみ使用されます。訓練されたウェイトを使用してケースの推論を使用する場合は、これらのデータセットをダウンロードする必要はありません。

ペプベンチ

ダウンロード

このペーパーでは最初に導入されたデータセットは、このURLでZenodoにアップロードされます。次のようにダウンロードできます。

mkdir datasets  # all datasets will be put into this directory
wget https://zenodo.org/records/13373108/files/train_valid.tar.gz ? download=1 -O ./datasets/train_valid.tar.gz   # training/validation
wget https://zenodo.org/records/13373108/files/LNR.tar.gz ? download=1 -O ./datasets/LNR.tar.gz   # test set
wget https://zenodo.org/records/13373108/files/ProtFrag.tar.gz ? download=1 -O ./datasets/ProtFrag.tar.gz     # augmentation dataset

減圧

tar zxvf ./datasets/train_valid.tar.gz -C ./datasets
tar zxvf ./datasets/LNR.tar.gz -C ./datasets
tar zxvf ./datasets/ProtFrag.tar.gz -C ./datasets

プロセス

python -m scripts.data_process.process --index ./datasets/train_valid/all.txt  --out_dir ./datasets/train_valid/processed  # train/validation set
python -m scripts.data_process.process --index ./datasets/LNR/test.txt  --out_dir ./datasets/LNR/processed  # test set
python -m scripts.data_process.process --index ./datasets/ProtFrag/all.txt --out_dir ./datasets/ProtFrag/processed # augmentation dataset

トレーニング/検証スプリットの処理されたデータのインデックスは次のように生成する必要があります。これにより、 datasets/train_valid/processed/train_index.txtとdatasets/train_valid/processed/valid_index.txtになります。

python -m scripts.data_process.split --train_index datasets/train_valid/train.txt --valid_index datasets/train_valid/valid.txt --processed_dir datasets/train_valid/processed/

pepbdb

ダウンロード

wget http://huanglab.phys.hust.edu.cn/pepbdb/db/download/pepbdb-20200318.tgz -O ./datasets/pepbdb.tgz

減圧

tar zxvf ./datasets/pepbdb.tgz -C ./datasets/pepbdb

プロセス

python -m scripts.data_process.pepbdb --index ./datasets/pepbdb/peptidelist.txt --out_dir ./datasets/pepbdb/processed
python -m scripts.data_process.split --train_index ./datasets/pepbdb/train.txt --valid_index ./datasets/pepbdb/valid.txt --test_index ./datasets/pepbdb/test.txt --processed_dir datasets/pepbdb/processed/
mv ./datasets/pepbdb/processed/pdbs ./dataset/pepbdb  # re-locate

訓練されたウェイト

CodeSign： ./checkpoint/codesign.ckpt CheckPoint/Codesign.ckpt
立体構造生成： ./checkpoints/fixseq.ckpt CheckPoints/fixSeq.ckpt

どちらもリリースページでダウンロードできます。これらのチェックポイントはペプベンチで訓練されました。

使用法

ショ和次のコードを使用する前に、最初に上記の訓練された重量をダウンロードしてください。

ペプチド配列構造の共同設計

./assets/1ssc_A_B.pdbを例として、チェーンAはターゲットタンパク質です。

 # obtain the binding site, which might also be manually crafted or from other ligands (e.g. small molecule, antibodies)
python -m api.detect_pocket --pdb assets/1ssc_A_B.pdb --target_chains A --ligand_chains B --out assets/1ssc_A_pocket.json
# sequence-structure codesign with length in [8, 15)
CUDA_VISIBLE_DEVICES=0 python -m api.run 
    --mode codesign 
    --pdb assets/1ssc_A_B.pdb 
    --pocket assets/1ssc_A_pocket.json 
    --out_dir ./output/codesign 
    --length_min 8 
    --length_max 15 
    --n_samples 10

その後、10世代がフォルダー./output/codesignの下に出力されます。

ペプチド結合立体構造生成

./assets/1ssc_A_B.pdbを例として、チェーンAはターゲットタンパク質です。

 # obtain the binding site, which might also be manually crafted or from other ligands (e.g. small molecule, antibodies)
python -m api.detect_pocket --pdb assets/1ssc_A_B.pdb --target_chains A --ligand_chains B --out assets/1ssc_A_pocket.json
# generate binding conformation
CUDA_VISIBLE_DEVICES=0 python -m api.run 
    --mode struct_pred 
    --pdb assets/1ssc_A_B.pdb 
    --pocket assets/1ssc_A_pocket.json 
    --out_dir ./output/struct_pred 
    --peptide_seq PYVPVHFDASV 
    --n_samples 10

次に、10個のコンフォメーションがフォルダー./output/struct_predの下に出力されます。

紙実験の複製

各タスクには、スクリプトに統合された次の手順が必要です./scripts/run_exp_pipe.sh ：

自動エンコーダーをトレーニングします
潜在的な拡散モデルを訓練します
連続した残基間の潜在距離の分布を計算します
生成と評価

一方、既存のチェックポイントを評価する場合は、以下の指示（例えば、立体構造の生成）に従ってください。

 # generate results on the test set and save to ./results/fixseq
python generate.py --config configs/pepbench/test_fixseq.yaml --ckpt checkpoints/fixseq.ckpt --gpu 0 --save_dir ./results/fixseq
# calculate metrics
python cal_metrics.py --results ./results/fixseq/results.jsonl

CodeSign

ペプベンチでのコード設計実験：

GPU=0 bash scripts/run_exp_pipe.sh pepbench_codesign configs/pepbench/autoencoder/train_codesign.yaml configs/pepbench/ldm/train_codesign.yaml configs/pepbench/ldm/setup_latent_guidance.yaml configs/pepbench/test_codesign.yaml

結合立体構造生成

Pepbenchでの立体構造生成実験：

GPU=0 bash scripts/run_exp_pipe.sh pepbench_fixseq configs/pepbench/autoencoder/train_fixseq.yaml configs/pepbench/ldm/train_fixseq.yaml configs/pepbench/ldm/setup_latent_guidance.yaml configs/pepbench/test_fixseq.yaml

接触

私たちの仕事にあなたの興味をありがとう！

アルゴリズム、コード、およびそれらを実行する際に遭遇する問題について質問して、それをより明確かつより良くすることができるようにしてください。 Github Repoで問題を作成するか、[email protected]でお問い合わせください。

参照

 @article { kong2024full ,
  title = { Full-atom peptide design with geometric latent diffusion } ,
  author = { Kong, Xiangzhe and Huang, Wenbing and Liu, Yang } ,
  journal = { arXiv preprint arXiv:2402.13555 } ,
  year = { 2024 }
}

拡大する

PepGLAD

Pepglad：幾何学的潜在拡散を備えたフルアトムペプチド設計

クイックリンク

設定

環境

（オプション）ピロセッタ

（オプション）データセット

ペプベンチ

pepbdb

訓練されたウェイト

使用法

ペプチド配列構造の共同設計

ペプチド結合立体構造生成

紙実験の複製

CodeSign

結合立体構造生成

接触

参照

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express