Unduh PepGLAD - Unduh Kode Sumber PepGLAD

Pepglad: Desain peptida atom penuh dengan difusi laten geometris

menutupi

Tautan cepat

Pengaturan
- Lingkungan
- Kumpulan data
- Bobot terlatih
Penggunaan
- Co-desain sekuens-struktur peptida
- Prediksi struktur pengikat peptida
Reproduksi Eksperimen Kertas
- Codesign
- Generasi konformasi yang mengikat
Kontak
Referensi

Pengaturan

Lingkungan

Lingkungan Conda dapat dibangun dengan configuration env.yaml :

conda env create -f env.yaml

Kode diuji dengan CUDA versi 11.7 dan Pytorch versi 1.13.1 .

Jangan lupa untuk mengaktifkan lingkungan sebelum menjalankan kode:

conda activate PepGLAD

(Opsional) Pyrosetta

Pyrosetta digunakan untuk menghitung energi antarmuka peptida yang dihasilkan. Jika Anda tertarik, silakan ikuti instruksi di sini untuk menginstal.

Dataset (Opsional)

Kumpulan data ini hanya digunakan untuk model pembandingan. Jika Anda hanya ingin menggunakan bobot terlatih untuk menyimpulkan pada kasus Anda, tidak perlu mengunduh kumpulan data ini.

Pepbench

Unduh

Kumpulan data, yang awalnya diperkenalkan dalam makalah ini, diunggah ke Zenodo di URL ini. Anda dapat mengunduhnya sebagai berikut:

mkdir datasets  # all datasets will be put into this directory
wget https://zenodo.org/records/13373108/files/train_valid.tar.gz ? download=1 -O ./datasets/train_valid.tar.gz   # training/validation
wget https://zenodo.org/records/13373108/files/LNR.tar.gz ? download=1 -O ./datasets/LNR.tar.gz   # test set
wget https://zenodo.org/records/13373108/files/ProtFrag.tar.gz ? download=1 -O ./datasets/ProtFrag.tar.gz     # augmentation dataset

Dekompresi

tar zxvf ./datasets/train_valid.tar.gz -C ./datasets
tar zxvf ./datasets/LNR.tar.gz -C ./datasets
tar zxvf ./datasets/ProtFrag.tar.gz -C ./datasets

Proses

python -m scripts.data_process.process --index ./datasets/train_valid/all.txt  --out_dir ./datasets/train_valid/processed  # train/validation set
python -m scripts.data_process.process --index ./datasets/LNR/test.txt  --out_dir ./datasets/LNR/processed  # test set
python -m scripts.data_process.process --index ./datasets/ProtFrag/all.txt --out_dir ./datasets/ProtFrag/processed # augmentation dataset

Indeks data yang diproses untuk pemisahan kereta/validasi perlu dihasilkan sebagai berikut, yang akan menghasilkan datasets/train_valid/processed/train_index.txt dan datasets/train_valid/processed/valid_index.txt :

python -m scripts.data_process.split --train_index datasets/train_valid/train.txt --valid_index datasets/train_valid/valid.txt --processed_dir datasets/train_valid/processed/

Pepbdb

Unduh

wget http://huanglab.phys.hust.edu.cn/pepbdb/db/download/pepbdb-20200318.tgz -O ./datasets/pepbdb.tgz

Dekompresi

tar zxvf ./datasets/pepbdb.tgz -C ./datasets/pepbdb

Proses

python -m scripts.data_process.pepbdb --index ./datasets/pepbdb/peptidelist.txt --out_dir ./datasets/pepbdb/processed
python -m scripts.data_process.split --train_index ./datasets/pepbdb/train.txt --valid_index ./datasets/pepbdb/valid.txt --test_index ./datasets/pepbdb/test.txt --processed_dir datasets/pepbdb/processed/
mv ./datasets/pepbdb/processed/pdbs ./dataset/pepbdb  # re-locate

Bobot terlatih

codesign: ./checkpoint/codesign.ckpt
Generasi Konformasi: ./checkpoints/fixseq.ckpt

Keduanya dapat diunduh di halaman rilis. Pos pemeriksaan ini dilatih di Pepbench.

Penggunaan

️ Sebelum menggunakan kode berikut, silakan unduh pertama -tama bobot terlatih yang disebutkan di atas.

Co-desain sekuens-struktur peptida

Ambil ./assets/1ssc_A_B.pdb sebagai contoh, di mana rantai A adalah protein target:

 # obtain the binding site, which might also be manually crafted or from other ligands (e.g. small molecule, antibodies)
python -m api.detect_pocket --pdb assets/1ssc_A_B.pdb --target_chains A --ligand_chains B --out assets/1ssc_A_pocket.json
# sequence-structure codesign with length in [8, 15)
CUDA_VISIBLE_DEVICES=0 python -m api.run 
    --mode codesign 
    --pdb assets/1ssc_A_B.pdb 
    --pocket assets/1ssc_A_pocket.json 
    --out_dir ./output/codesign 
    --length_min 8 
    --length_max 15 
    --n_samples 10

Maka 10 generasi akan dikeluarkan di bawah folder ./output/codesign .

Generasi konformasi pengikat peptida

Ambil ./assets/1ssc_A_B.pdb sebagai contoh, di mana rantai A adalah protein target:

 # obtain the binding site, which might also be manually crafted or from other ligands (e.g. small molecule, antibodies)
python -m api.detect_pocket --pdb assets/1ssc_A_B.pdb --target_chains A --ligand_chains B --out assets/1ssc_A_pocket.json
# generate binding conformation
CUDA_VISIBLE_DEVICES=0 python -m api.run 
    --mode struct_pred 
    --pdb assets/1ssc_A_B.pdb 
    --pocket assets/1ssc_A_pocket.json 
    --out_dir ./output/struct_pred 
    --peptide_seq PYVPVHFDASV 
    --n_samples 10

Maka 10 konformasi akan dikeluarkan di bawah folder ./output/struct_pred .

Reproduksi Eksperimen Kertas

Setiap tugas membutuhkan langkah -langkah berikut, yang telah kami berintegrasi ke dalam skrip ./scripts/run_exp_pipe.sh :

Latih Autoencoder
Latih model difusi laten
Hitung distribusi jarak laten antara residu berturut -turut
Generasi & Evaluasi

Di sisi lain, jika Anda ingin mengevaluasi pos pemeriksaan yang ada, silakan ikuti instruksi di bawah ini (misalnya generasi konformasi):

 # generate results on the test set and save to ./results/fixseq
python generate.py --config configs/pepbench/test_fixseq.yaml --ckpt checkpoints/fixseq.ckpt --gpu 0 --save_dir ./results/fixseq
# calculate metrics
python cal_metrics.py --results ./results/fixseq/results.jsonl

Codesign

Eksperimen CodeSign di Pepbench:

GPU=0 bash scripts/run_exp_pipe.sh pepbench_codesign configs/pepbench/autoencoder/train_codesign.yaml configs/pepbench/ldm/train_codesign.yaml configs/pepbench/ldm/setup_latent_guidance.yaml configs/pepbench/test_codesign.yaml

Generasi konformasi yang mengikat

Eksperimen Generasi Konformasi pada Pepbench:

GPU=0 bash scripts/run_exp_pipe.sh pepbench_fixseq configs/pepbench/autoencoder/train_fixseq.yaml configs/pepbench/ldm/train_fixseq.yaml configs/pepbench/ldm/setup_latent_guidance.yaml configs/pepbench/test_fixseq.yaml

Kontak

Terima kasih atas minat Anda pada pekerjaan kami!

Silakan bertanya tentang pertanyaan tentang algoritma, kode, serta masalah yang dihadapi dalam menjalankannya sehingga kami dapat membuatnya lebih jelas dan lebih baik. Anda dapat membuat masalah dalam repo GitHub atau hubungi kami di [email protected].

Referensi

 @article { kong2024full ,
  title = { Full-atom peptide design with geometric latent diffusion } ,
  author = { Kong, Xiangzhe and Huang, Wenbing and Liu, Yang } ,
  journal = { arXiv preprint arXiv:2402.13555 } ,
  year = { 2024 }
}

Memperluas

PepGLAD

Pepglad: Desain peptida atom penuh dengan difusi laten geometris

Tautan cepat

Pengaturan

Lingkungan

(Opsional) Pyrosetta

Dataset (Opsional)

Pepbench

Pepbdb

Bobot terlatih

Penggunaan

Co-desain sekuens-struktur peptida

Generasi konformasi pengikat peptida

Reproduksi Eksperimen Kertas

Codesign

Generasi konformasi yang mengikat

Kontak

Referensi

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express