توليد جزيء لربط البروتين المستهدف مع الزخارف الهيكلية

يعد تصميم جزيئات يجند التي ترتبط بمواقع ربط بروتين محددة مشكلة أساسية في تصميم الدواء القائم على الهيكل. على الرغم من أن النماذج التوليدية العميقة والتعلم العميق الهندسي أحرزت تقدمًا كبيرًا في تصميم الأدوية ، إلا أن الأعمال الموجودة إما عينة في مساحة الرسم البياني ثنائي الأبعاد أو تفشل في توليد جزيئات صالحة مع هياكل واقعية. لمعالجة هذه المشكلات ، نقترح إطار عمل L IG A ND G Eneration ( FLAG ) ، لإنشاء جزيئات ثلاثية الأبعاد ذات شظية بنية محدودة واقعية. في العلم ، يتم إنشاء مفردات زخارية عن طريق استخراج شظايا جزيئية شائعة (أي عزر) في مجموعة البيانات. في كل خطوة جيل ، يتم استخدام شبكة عصبية ثلاثية الأبعاد لأول مرة لتشفير معلومات السياق الوسيط. بعد ذلك ، يختار نموذجنا الحافز البؤري ، ويتنبأ بنوع الحافز التالي ، ويعلق الحافز الجديد. يمكن تحديد أطوال/زوايا الرابطة بسرعة ودقة بواسطة أدوات المعلوماتية الكيميائية. أخيرًا ، يتم تعديل الهندسة الجزيئية بشكل أكبر وفقًا لزاوية الدوران المتوقعة وصقل الهيكل. لا يحقق نموذجنا عروضًا تنافسية فقط على المقاييس التقليدية مثل التقارب الملزم ، و QED ، و SA ، ولكن أيضًا يتفوق على خطوط الأساس بهامش كبير في توليد الجزيئات ذات الهياكل الأساسية الواقعة.
conda env create -f flag_env.yaml
conda activate flag_env يرجى الرجوع إلى README.md في مجلد data .
python build_vocab.py
python train.py
python motif_sample.py
العرض التوضيحي: https://huggingface.co/spaces/zaixi/iclr_flag
نقاط التفتيش: https://drive.google.com/drive/folders/1ni-tl7yzymsfljezxatxbpuio7lvubt9؟usp=drive_link

يتم تخزين الهياكل الجزيئية المولدة لـ 100 هدف بروتين في flag_gen.pt
ملف الفهرس هو test_index.pkl
@inproceedings{
zhang2023molecule,
title={Molecule Generation For Target Protein Binding with Structural Motifs},
author={ZAIXI ZHANG and Shuxin Zheng and Yaosen Min and Qi Liu},
booktitle={International Conference on Learning Representations},
year={2023},
url={https://openreview.net/forum?id=Rq13idF0F73}
}