conda create -n ppflow python==3.9
conda activate ppflow
# install requirements
pip install -r requirements.txt
pip install easydict
pip install biopython
# mmseq
conda install bioconda::mmseqs2
# Alternative: obabel and RDkit
conda install -c openbabel openbabel
conda install conda-forge::rdkit
# Alternative for visualization: py3dmol
conda install conda-forge::py3dmol
# torch-geomstats
conda install -c conda-forge geomstats
# torch-scatter
pip install torch-scatter -f https://data.pyg.org/whl/torch-1.13.0+cu117.html
# OR: stable torch-scatter
pip install ./temp/torch_scatter-2.1.1+pt113cu117-cp39-cp39-linux_x86_64.whl
我們通過Google Drive以及處理後的“ PPDBench”提供了PPBench2024的處理後數據集。
請下載data.zip並解壓縮它,導致數據文件目錄作為
- data
- processed
cluster_result_all_seqs.fasta
cluster_result_cluster.tsv
cluster_result_rep_seq.fasta
parsed_pair.pt
receptor_sequences.fasta
split.pt
- processed_bench
cluster_result_all_seqs.fasta
cluster_result_cluster.tsv
cluster_result_rep_seq.fasta
parsed_pair.pt
receptor_sequences.fasta
split.pt
pdb_benchmark.pt
pdb_filtered.pt
如果您需要用於預處理的RAW數據集,請通過Google Drive下載它們。解開datasets_raw.zip的文件,導致目錄為目錄
- dataset
- PPDbench
- 1cjr
peptide.pdb
recepotor.pdb
- 1cka
peptide.pdb
recepotor.pdb
...
- ppbench2024
- 1a0m_A
peptide.pdb
recepotor.pdb
運行以下命令進行PPFlow培訓:
python train_ppf.py
運行以下命令進行DIFFPP培訓:
python train_diffpp.py
對於RDE Finetuning,您應該首先從Google驅動器下載驗證的RDE.pt型號,然後將其保存為./pretrained/RDE.pt ,最後運行以下命令以進行finetuning:
python train_rde.py --fine_tune ./pretrained/RDE.pt
python codesign_diffpp.py -ckpt {where-the-trained-ckpt-is}
python codesign_ppflow.py -ckpt {where-the-trained-ckpt-is}
在這裡,我們給出了驗證的檢查點,該檢查點被命名為ppflow_pretrained.pt ,可以從Google驅動器下載。您可以將其直接下載並將其複製到./pretrained/ppflow_pretrained.pt 。此外,一代運行以下內容:
python codesign_diffpp.py -ckpt ./pretrained/ppflow_pretrained.pt
如果要直接評估肽,我們將肽作為codesign_results.tar.gz提供的Google Drive,該肽由100個樣品 /蛋白質結構組成,以進行更穩定的評估,結果給出了
| imp%-s(↑) | 有效性(↑) | 新奇(↑) | 多樣性 |
|---|---|---|---|
| 12.50% | 1.00 | 0.99 | 0.92 |
您應該評估以_bb3.pdb為生成的PDB的文件,因為_bb4.pdb中的O元素在我們的重建函數中不穩定。
conda install conda-forge::vina
pip install meeko
pip install git+https://github.com/Valdes-Tresanco-MS/AutoDockTools_py3.git@aee55d50d5bdcfdbcd80220499df8cde2a8f4b2a
pip install pdb2pqr
./tools/dock/vinadock.py給出了Vinadock的Python界面的示例。
apt-get install -y libfftw3-3 Hdock需要Libfftw3。此外,可以通過以下方式下載Hdock軟件:http://huanglab.phys.hust.edu.cn/software/hdocklite/。下載後,安裝或解壓縮到./bin目錄,導致文件結構作為 - bin
- hdock
1CGl_l_b.pdb
1CGl_r_b.pdb
createpl
hdock
./tools/dock/hdock.py給出了我們的python接口的示例。
conda config --add channels https://yourauthorizedid:[email protected]
conda install pyrosetta
./tools/relax/rosetta_packing.py給出了Rosetta側鏈包裝的python接口的示例。
./bin 。然後,解開它,這將導致目錄看起來像 - bin
- FoldX
foldx
foldx是軟件。 ./tools/score/foldx_energy.py給出了我們的Python接口以進行foldx穩定性的示例。
./bin中提供可用的ADFRSUITE軟件。如果它與系統不兼容,請通過https://ccsb.scripps.edu/adcp/downloads/安裝它。將ADFRsuite_x86_64Linux_1.0.tar複製到./bin中。最後,安裝的ADCP中的./bin bin應該看起來像 - bin
- ADFRsuite_x86_64Linux_1.0
- Tools
CCSBpckgs.tar.gz
...
ADFRsuite_Linux-x86_64_1.0_install.run
uninstall
記住將其添加到您的env-path中
export PATH={Absolute-path-of-ppfolw}/bin/ADFRsuite_x86_64Linux_1.0/bin:$PATH
./tools/dock/adcpdock.py給出了我們用於adcpdocking的Python接口的示例。
./bin中提供 - bin
- TMscore
TMscore
TMscore.cpp
首先,克隆到./bin
cd ./bin
git clone https://github.com/pharmai/plip.git
cd plip
python setup.py install
alias plip='python {Absolute-path-of-ppfolw}/bin/plip/plip/plipcmd.py'
./tools/interaction/interaction_analysis.py給出了我們的Python接口進行PLIP交互分析的示例。
評估腳本以./evaluation評估目錄給出,您可以在主要實驗中運行以下評估:
# Evaluting the docking energy
python eval_bind.py --gen_dir {where-the-generated-peptide-is} --ref_dir {where-the-protein-pdb-is} --save_path {where-you-want-the-docked-peptide-to-be-saved-in}
# Evaluating the sequence and structure
python eval_bind.py --gen_dir {where-the-generated-peptide-is} --ref_dir {where-the-protein-pdb-is} --save_path {where-you-want-the-docked-peptide-to-be-saved-in}
我們給出一個示例文件對,因此gen_dir可以是./results/ppflow/codesign_ppflow/0008_3tzy_2024_01_19__19_16_21 /ppflow/ ./results/ppflow/codesign_ppflow/0008_3tzy_2024_01_19__19_16_21 /0008_3TZY_2024_01_19_19_19_19_16_21, ref_dir可以是./PPDbench/3tzy/可以save_path 。
如果我們的論文或存儲庫中的代碼對您有所幫助,請引用以下內容:
@inproceedings{lin2024ppflow,
author = {Lin, Haitao and Zhang, Odin and Zhao, Huifeng and Jiang, Dejun and Wu, Lirong and Liu, Zicheng and Huang, Yufei and Li, Stan Z.},
title = {PPFlow: Target-Aware Peptide Design with Torsional Flow Matching},
year = {2024},
booktitle={International Conference on Machine Learning},
URL = {https://www.biorxiv.org/content/early/2024/03/08/2024.03.07.583831},
eprint = {https://www.biorxiv.org/content/early/2024/03/08/2024.03.07.583831.full.pdf},
}