
Lingkungan Conda dapat dibangun dengan configuration env.yaml :
conda env create -f env.yaml Kode diuji dengan CUDA versi 11.7 dan Pytorch versi 1.13.1 .
Jangan lupa untuk mengaktifkan lingkungan sebelum menjalankan kode:
conda activate PepGLADPyrosetta digunakan untuk menghitung energi antarmuka peptida yang dihasilkan. Jika Anda tertarik, silakan ikuti instruksi di sini untuk menginstal.
Kumpulan data ini hanya digunakan untuk model pembandingan. Jika Anda hanya ingin menggunakan bobot terlatih untuk menyimpulkan pada kasus Anda, tidak perlu mengunduh kumpulan data ini.
Kumpulan data, yang awalnya diperkenalkan dalam makalah ini, diunggah ke Zenodo di URL ini. Anda dapat mengunduhnya sebagai berikut:
mkdir datasets # all datasets will be put into this directory
wget https://zenodo.org/records/13373108/files/train_valid.tar.gz ? download=1 -O ./datasets/train_valid.tar.gz # training/validation
wget https://zenodo.org/records/13373108/files/LNR.tar.gz ? download=1 -O ./datasets/LNR.tar.gz # test set
wget https://zenodo.org/records/13373108/files/ProtFrag.tar.gz ? download=1 -O ./datasets/ProtFrag.tar.gz # augmentation datasettar zxvf ./datasets/train_valid.tar.gz -C ./datasets
tar zxvf ./datasets/LNR.tar.gz -C ./datasets
tar zxvf ./datasets/ProtFrag.tar.gz -C ./datasetspython -m scripts.data_process.process --index ./datasets/train_valid/all.txt --out_dir ./datasets/train_valid/processed # train/validation set
python -m scripts.data_process.process --index ./datasets/LNR/test.txt --out_dir ./datasets/LNR/processed # test set
python -m scripts.data_process.process --index ./datasets/ProtFrag/all.txt --out_dir ./datasets/ProtFrag/processed # augmentation dataset Indeks data yang diproses untuk pemisahan kereta/validasi perlu dihasilkan sebagai berikut, yang akan menghasilkan datasets/train_valid/processed/train_index.txt dan datasets/train_valid/processed/valid_index.txt :
python -m scripts.data_process.split --train_index datasets/train_valid/train.txt --valid_index datasets/train_valid/valid.txt --processed_dir datasets/train_valid/processed/wget http://huanglab.phys.hust.edu.cn/pepbdb/db/download/pepbdb-20200318.tgz -O ./datasets/pepbdb.tgztar zxvf ./datasets/pepbdb.tgz -C ./datasets/pepbdbpython -m scripts.data_process.pepbdb --index ./datasets/pepbdb/peptidelist.txt --out_dir ./datasets/pepbdb/processed
python -m scripts.data_process.split --train_index ./datasets/pepbdb/train.txt --valid_index ./datasets/pepbdb/valid.txt --test_index ./datasets/pepbdb/test.txt --processed_dir datasets/pepbdb/processed/
mv ./datasets/pepbdb/processed/pdbs ./dataset/pepbdb # re-locate./checkpoint/codesign.ckpt./checkpoints/fixseq.ckptKeduanya dapat diunduh di halaman rilis. Pos pemeriksaan ini dilatih di Pepbench.
Ambil ./assets/1ssc_A_B.pdb sebagai contoh, di mana rantai A adalah protein target:
# obtain the binding site, which might also be manually crafted or from other ligands (e.g. small molecule, antibodies)
python -m api.detect_pocket --pdb assets/1ssc_A_B.pdb --target_chains A --ligand_chains B --out assets/1ssc_A_pocket.json
# sequence-structure codesign with length in [8, 15)
CUDA_VISIBLE_DEVICES=0 python -m api.run
--mode codesign
--pdb assets/1ssc_A_B.pdb
--pocket assets/1ssc_A_pocket.json
--out_dir ./output/codesign
--length_min 8
--length_max 15
--n_samples 10 Maka 10 generasi akan dikeluarkan di bawah folder ./output/codesign .
Ambil ./assets/1ssc_A_B.pdb sebagai contoh, di mana rantai A adalah protein target:
# obtain the binding site, which might also be manually crafted or from other ligands (e.g. small molecule, antibodies)
python -m api.detect_pocket --pdb assets/1ssc_A_B.pdb --target_chains A --ligand_chains B --out assets/1ssc_A_pocket.json
# generate binding conformation
CUDA_VISIBLE_DEVICES=0 python -m api.run
--mode struct_pred
--pdb assets/1ssc_A_B.pdb
--pocket assets/1ssc_A_pocket.json
--out_dir ./output/struct_pred
--peptide_seq PYVPVHFDASV
--n_samples 10 Maka 10 konformasi akan dikeluarkan di bawah folder ./output/struct_pred .
Setiap tugas membutuhkan langkah -langkah berikut, yang telah kami berintegrasi ke dalam skrip ./scripts/run_exp_pipe.sh :
Di sisi lain, jika Anda ingin mengevaluasi pos pemeriksaan yang ada, silakan ikuti instruksi di bawah ini (misalnya generasi konformasi):
# generate results on the test set and save to ./results/fixseq
python generate.py --config configs/pepbench/test_fixseq.yaml --ckpt checkpoints/fixseq.ckpt --gpu 0 --save_dir ./results/fixseq
# calculate metrics
python cal_metrics.py --results ./results/fixseq/results.jsonlEksperimen CodeSign di Pepbench:
GPU=0 bash scripts/run_exp_pipe.sh pepbench_codesign configs/pepbench/autoencoder/train_codesign.yaml configs/pepbench/ldm/train_codesign.yaml configs/pepbench/ldm/setup_latent_guidance.yaml configs/pepbench/test_codesign.yamlEksperimen Generasi Konformasi pada Pepbench:
GPU=0 bash scripts/run_exp_pipe.sh pepbench_fixseq configs/pepbench/autoencoder/train_fixseq.yaml configs/pepbench/ldm/train_fixseq.yaml configs/pepbench/ldm/setup_latent_guidance.yaml configs/pepbench/test_fixseq.yamlTerima kasih atas minat Anda pada pekerjaan kami!
Silakan bertanya tentang pertanyaan tentang algoritma, kode, serta masalah yang dihadapi dalam menjalankannya sehingga kami dapat membuatnya lebih jelas dan lebih baik. Anda dapat membuat masalah dalam repo GitHub atau hubungi kami di [email protected].
@article { kong2024full ,
title = { Full-atom peptide design with geometric latent diffusion } ,
author = { Kong, Xiangzhe and Huang, Wenbing and Liu, Yang } ,
journal = { arXiv preprint arXiv:2402.13555 } ,
year = { 2024 }
}