conda create -n ppflow python==3.9
conda activate ppflow
# install requirements
pip install -r requirements.txt
pip install easydict
pip install biopython
# mmseq
conda install bioconda::mmseqs2
# Alternative: obabel and RDkit
conda install -c openbabel openbabel
conda install conda-forge::rdkit
# Alternative for visualization: py3dmol
conda install conda-forge::py3dmol
# torch-geomstats
conda install -c conda-forge geomstats
# torch-scatter
pip install torch-scatter -f https://data.pyg.org/whl/torch-1.13.0+cu117.html
# OR: stable torch-scatter
pip install ./temp/torch_scatter-2.1.1+pt113cu117-cp39-cp39-linux_x86_64.whl
Мы предоставляем обработанный набор данных PPBench2024 через Google Drive, вместе с обработанным «ppdbench».
Пожалуйста, загрузите data.zip и распаковать его, что приводит к каталогу файлов данных как
- data
- processed
cluster_result_all_seqs.fasta
cluster_result_cluster.tsv
cluster_result_rep_seq.fasta
parsed_pair.pt
receptor_sequences.fasta
split.pt
- processed_bench
cluster_result_all_seqs.fasta
cluster_result_cluster.tsv
cluster_result_rep_seq.fasta
parsed_pair.pt
receptor_sequences.fasta
split.pt
pdb_benchmark.pt
pdb_filtered.pt
Если вы хотите необработанные наборы данных для предварительной обработки, пожалуйста, загрузите их через Google Drive. Раскрыть файл datasets_raw.zip , ведущий к каталогу как
- dataset
- PPDbench
- 1cjr
peptide.pdb
recepotor.pdb
- 1cka
peptide.pdb
recepotor.pdb
...
- ppbench2024
- 1a0m_A
peptide.pdb
recepotor.pdb
Запустите следующую команду для обучения PPFLOW:
python train_ppf.py
Запустите следующую команду для обучения DIFFP:
python train_diffpp.py
Для RDE PeneTuning вам следует сначала загрузить предварительную модель RDE.pt с Google Drive, затем сохранить ее как ./pretrained/RDE.pt , и, наконец, запустите следующую команду для MineTuning:
python train_rde.py --fine_tune ./pretrained/RDE.pt
python codesign_diffpp.py -ckpt {where-the-trained-ckpt-is}
python codesign_ppflow.py -ckpt {where-the-trained-ckpt-is}
Здесь мы даем контрольные точки, которые предварительно проведены, которые называются ppflow_pretrained.pt и могут быть загружены с Google Drive. Вы можете напрямую загрузить его и скопировать на ./pretrained/ppflow_pretrained.pt . Кроме того, запустите следующее в поколении:
python codesign_diffpp.py -ckpt ./pretrained/ppflow_pretrained.pt
Если вы хотите напрямую оценить пептиды, мы предоставляем пептиды как codesign_results.tar.gz из нашего Google Drive, который состоит из 100 образцов / структуры белка для более стабильной оценки, с результатами, приведенными как
| IMP%-S (↑) | Обоснованность (↑) | Новинка (↑) | Разнообразие |
|---|---|---|---|
| 12,50% | 1,00 | 0,99 | 0,92 |
Вы должны оценить файлы, которые заканчиваются _bb3.pdb в качестве сгенерированного PDB, поскольку элемент O в _bb4.pdb нестабилен в нашей функции реконструкции.
conda install conda-forge::vina
pip install meeko
pip install git+https://github.com/Valdes-Tresanco-MS/AutoDockTools_py3.git@aee55d50d5bdcfdbcd80220499df8cde2a8f4b2a
pip install pdb2pqr
./tools/dock/vinadock.py приводит пример нашего интерфейса Python для Vinadock.
apt-get install -y libfftw3-3 . Кроме того, программное обеспечение HDock может быть загружено через: http://huanglab.phys.hust.edu.cn/software/hdocklite/. После загрузки, установите или разкапливает его в каталог ./bin , что приводит к структуре файла как - bin
- hdock
1CGl_l_b.pdb
1CGl_r_b.pdb
createpl
hdock
./tools/dock/hdock.py приводит пример нашего интерфейса Python для HDock.
conda config --add channels https://yourauthorizedid:[email protected]
conda install pyrosetta
./tools/relax/rosetta_packing.py приводит пример нашего интерфейса Python для упаковки боковой цепи Rosetta.
./bin . Затем расстегнут его, что приведет к тому, что каталог будет выглядеть - bin
- FoldX
foldx
Где FOLDX - это программное обеспечение. ./tools/score/foldx_energy.py приводит пример нашего интерфейса Python для стабильности FOLTX.
./bin . Если он не совместим с вашей системой, пожалуйста, установите его через https://ccsb.scripps.edu/adcp/downloads/. Скопируйте ADFRsuite_x86_64Linux_1.0.tar в ./bin . Наконец, установлен ADCP в ./bin должен выглядеть как - bin
- ADFRsuite_x86_64Linux_1.0
- Tools
CCSBpckgs.tar.gz
...
ADFRsuite_Linux-x86_64_1.0_install.run
uninstall
Не забудьте добавить его в свой env-path как
export PATH={Absolute-path-of-ppfolw}/bin/ADFRsuite_x86_64Linux_1.0/bin:$PATH
./tools/dock/adcpdock.py приводит пример нашего интерфейса Python для ADCPDocking.
./bin , как - bin
- TMscore
TMscore
TMscore.cpp
Во -первых, клонировать его в ./bin
cd ./bin
git clone https://github.com/pharmai/plip.git
cd plip
python setup.py install
alias plip='python {Absolute-path-of-ppfolw}/bin/plip/plip/plipcmd.py'
./tools/interaction/interaction_analysis.py приводит пример нашего интерфейса Python для анализа взаимодействия PLIP.
Сценарии оценки приведены в каталоге ./evaluation , вы можете запустить следующее для оценки в основных экспериментах:
# Evaluting the docking energy
python eval_bind.py --gen_dir {where-the-generated-peptide-is} --ref_dir {where-the-protein-pdb-is} --save_path {where-you-want-the-docked-peptide-to-be-saved-in}
# Evaluating the sequence and structure
python eval_bind.py --gen_dir {where-the-generated-peptide-is} --ref_dir {where-the-protein-pdb-is} --save_path {where-you-want-the-docked-peptide-to-be-saved-in}
Мы даем пример пары файлов, поэтому gen_dir может быть ./results/ppflow/codesign_ppflow/0008_3tzy_2024_01_19__19_16_21 , ref_dir может быть ./PPDbench/3tzy/ , а save_path может быть ./results/ppflow/codesign_ppflow/0008_3tzy_2024_01_19__19_16_21 .
Если наша статья или код в репозитории полезны для вас, пожалуйста, укажите следующее:
@inproceedings{lin2024ppflow,
author = {Lin, Haitao and Zhang, Odin and Zhao, Huifeng and Jiang, Dejun and Wu, Lirong and Liu, Zicheng and Huang, Yufei and Li, Stan Z.},
title = {PPFlow: Target-Aware Peptide Design with Torsional Flow Matching},
year = {2024},
booktitle={International Conference on Machine Learning},
URL = {https://www.biorxiv.org/content/early/2024/03/08/2024.03.07.583831},
eprint = {https://www.biorxiv.org/content/early/2024/03/08/2024.03.07.583831.full.pdf},
}