تنزيل PepGLAD - تنزيل رمز المصدر PepGLAD

Pepglad: تصميم الببتيد الكامل مع الانتشار الكامن الهندسي

غطاء

روابط سريعة

يثبت
- بيئة
- مجموعات البيانات
- الأوزان المدربة
الاستخدام
- ببتيد تسلسل بنية co-bruction
- التنبؤ ببنية ربط الببتيد
استنساخ تجارب الورق
- رمز
- جيل التشكل الملزم
اتصال
مرجع

يثبت

بيئة

يمكن بناء بيئة كوندا مع تكوين env.yaml :

conda env create -f env.yaml

يتم اختبار الرموز مع الإصدار 11.7 CUDA و Pytorch الإصدار 1.13.1 .

لا تنس تنشيط البيئة قبل تشغيل الرموز:

conda activate PepGLAD

(اختياري) Pyrosetta

يتم استخدام pyrosetta لحساب طاقة الواجهة للببتيدات التي تم إنشاؤها. إذا كنت مهتمًا به ، فيرجى اتباع التعليمات هنا للتثبيت.

(اختياري) مجموعات البيانات

تستخدم مجموعات البيانات هذه فقط لنماذج القياس. إذا كنت ترغب فقط في استخدام الأوزان المدربة للاستدلال على حالاتك ، فليست هناك حاجة لتنزيل مجموعات البيانات هذه.

بيببش

تحميل

يتم تحميل مجموعات البيانات ، التي تم تقديمها في الأصل في هذه الورقة ، إلى Zenodo في عنوان URL هذا. يمكنك تنزيلها على النحو التالي:

mkdir datasets  # all datasets will be put into this directory
wget https://zenodo.org/records/13373108/files/train_valid.tar.gz ? download=1 -O ./datasets/train_valid.tar.gz   # training/validation
wget https://zenodo.org/records/13373108/files/LNR.tar.gz ? download=1 -O ./datasets/LNR.tar.gz   # test set
wget https://zenodo.org/records/13373108/files/ProtFrag.tar.gz ? download=1 -O ./datasets/ProtFrag.tar.gz     # augmentation dataset

تخفيض الضغط

tar zxvf ./datasets/train_valid.tar.gz -C ./datasets
tar zxvf ./datasets/LNR.tar.gz -C ./datasets
tar zxvf ./datasets/ProtFrag.tar.gz -C ./datasets

عملية

python -m scripts.data_process.process --index ./datasets/train_valid/all.txt  --out_dir ./datasets/train_valid/processed  # train/validation set
python -m scripts.data_process.process --index ./datasets/LNR/test.txt  --out_dir ./datasets/LNR/processed  # test set
python -m scripts.data_process.process --index ./datasets/ProtFrag/all.txt --out_dir ./datasets/ProtFrag/processed # augmentation dataset

يجب إنشاء فهرس البيانات المصنعة لتقسيم القطار/التحقق من الصحة على النحو التالي ، مما سيؤدي إلى datasets/train_valid/processed/train_index.txt و datasets/train_valid/processed/valid_index.txt :

python -m scripts.data_process.split --train_index datasets/train_valid/train.txt --valid_index datasets/train_valid/valid.txt --processed_dir datasets/train_valid/processed/

PEPBDB

تحميل

wget http://huanglab.phys.hust.edu.cn/pepbdb/db/download/pepbdb-20200318.tgz -O ./datasets/pepbdb.tgz

فك الضغط

tar zxvf ./datasets/pepbdb.tgz -C ./datasets/pepbdb

عملية

python -m scripts.data_process.pepbdb --index ./datasets/pepbdb/peptidelist.txt --out_dir ./datasets/pepbdb/processed
python -m scripts.data_process.split --train_index ./datasets/pepbdb/train.txt --valid_index ./datasets/pepbdb/valid.txt --test_index ./datasets/pepbdb/test.txt --processed_dir datasets/pepbdb/processed/
mv ./datasets/pepbdb/processed/pdbs ./dataset/pepbdb  # re-locate

الأوزان المدربة

Codesign: ./checkpoint/codesign.ckpt
توليد التشكل: ./checkpoints/fixseq.ckpt

يمكن تنزيل كلاهما في صفحة الإصدار. تم تدريب نقاط التفتيش هذه على pepbench.

الاستخدام

️ قبل استخدام الرموز التالية ، يرجى أولاً تنزيل الأوزان المدربة المذكورة أعلاه.

ببتيد تسلسل بنية co-bruction

خذ ./assets/1ssc_A_B.pdb

 # obtain the binding site, which might also be manually crafted or from other ligands (e.g. small molecule, antibodies)
python -m api.detect_pocket --pdb assets/1ssc_A_B.pdb --target_chains A --ligand_chains B --out assets/1ssc_A_pocket.json
# sequence-structure codesign with length in [8, 15)
CUDA_VISIBLE_DEVICES=0 python -m api.run 
    --mode codesign 
    --pdb assets/1ssc_A_B.pdb 
    --pocket assets/1ssc_A_pocket.json 
    --out_dir ./output/codesign 
    --length_min 8 
    --length_max 15 
    --n_samples 10

ثم سيتم إخراج 10 أجيال تحت المجلد ./output/codesign .

جيل التشكل الببتيد

خذ ./assets/1ssc_A_B.pdb

 # obtain the binding site, which might also be manually crafted or from other ligands (e.g. small molecule, antibodies)
python -m api.detect_pocket --pdb assets/1ssc_A_B.pdb --target_chains A --ligand_chains B --out assets/1ssc_A_pocket.json
# generate binding conformation
CUDA_VISIBLE_DEVICES=0 python -m api.run 
    --mode struct_pred 
    --pdb assets/1ssc_A_B.pdb 
    --pocket assets/1ssc_A_pocket.json 
    --out_dir ./output/struct_pred 
    --peptide_seq PYVPVHFDASV 
    --n_samples 10

ثم سيتم إخراج 10 مطابقة تحت المجلد ./output/struct_pred .

استنساخ تجارب الورق

تتطلب كل مهمة الخطوات التالية ، التي قمنا بدمجها في البرنامج النصي ./scripts/run_exp_pipe.sh :

تدريب Autoencoder
تدريب نموذج الانتشار الكامن
حساب توزيع المسافات الكامنة بين البقايا المتتالية
توليد وتقييم

من ناحية أخرى ، إذا كنت ترغب في تقييم نقاط التفتيش الحالية ، فيرجى اتباع الإرشادات أدناه (على سبيل المثال توليد التشكل):

 # generate results on the test set and save to ./results/fixseq
python generate.py --config configs/pepbench/test_fixseq.yaml --ckpt checkpoints/fixseq.ckpt --gpu 0 --save_dir ./results/fixseq
# calculate metrics
python cal_metrics.py --results ./results/fixseq/results.jsonl

رمز

تجارب التصميم على pepbench:

GPU=0 bash scripts/run_exp_pipe.sh pepbench_codesign configs/pepbench/autoencoder/train_codesign.yaml configs/pepbench/ldm/train_codesign.yaml configs/pepbench/ldm/setup_latent_guidance.yaml configs/pepbench/test_codesign.yaml

جيل التشكل الملزم

تجارب توليد التشكل على Pepbbench:

GPU=0 bash scripts/run_exp_pipe.sh pepbench_fixseq configs/pepbench/autoencoder/train_fixseq.yaml configs/pepbench/ldm/train_fixseq.yaml configs/pepbench/ldm/setup_latent_guidance.yaml configs/pepbench/test_fixseq.yaml

اتصال

شكرا لك على اهتمامك بعملنا!

لا تتردد في طرح أي أسئلة حول الخوارزميات والرموز ، وكذلك المشكلات التي واجهتها في تشغيلها حتى نتمكن من جعلها أكثر وضوحًا وأفضل. يمكنك إما إنشاء مشكلة في Github Repo أو الاتصال بنا على [email protected].

مرجع

 @article { kong2024full ,
  title = { Full-atom peptide design with geometric latent diffusion } ,
  author = { Kong, Xiangzhe and Huang, Wenbing and Liu, Yang } ,
  journal = { arXiv preprint arXiv:2402.13555 } ,
  year = { 2024 }
}

يوسع

PepGLAD

Pepglad: تصميم الببتيد الكامل مع الانتشار الكامن الهندسي

روابط سريعة

يثبت

بيئة

(اختياري) Pyrosetta

(اختياري) مجموعات البيانات

بيببش

PEPBDB

الأوزان المدربة

الاستخدام

ببتيد تسلسل بنية co-bruction

جيل التشكل الببتيد

استنساخ تجارب الورق

رمز

جيل التشكل الملزم

اتصال

مرجع

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express