نشرت الآن في أوكسفورد الأكاديمية - تقدم المعلوماتية الحيوية
https://academic.oup.com/BioInformaticsadvices/article/2/1/vbac021/6561563
يتم استخدام الببتيدات المضادة للميكروبات (AMPs) بشكل متزايد في تطوير الأدوية العلاجية الجديدة ، في مناطق مثل علاج السرطان وارتفاع ضغط الدم. بالإضافة إلى ذلك ، يُنظر إليهم كبديل للمضادات الحيوية بسبب زيادة المقاومة البكتيرية. ومع ذلك ، فإن التعرف التجريبي الرطب على حد سواء يستغرق وقتًا طويلاً ومكلفًا ، لذلك يتم استخدام النماذج الموجودة في السيليكو بشكل شائع من أجل فحص مرشحين AMP الجدد. تقترح هذه الورقة نهجًا جديدًا لإنشاء مدخلات نموذجية ؛ باستخدام نماذج اللغة التي تم تدريبها مسبقًا لإنتاج التضمينات السياقية التي تمثل الأحماض الأمينية داخل كل تسلسل الببتيد ، قبل أن يتم تدريب شبكة عصبية تلافيفية على أنها التصنيف. تم التحقق من صحة النموذج الأمثل على مجموعتي بيانات ، حيث يتم استخدامه مسبقًا في أبحاث التنبؤ AMP ، ومجموعة بيانات مستقلة ، تم إنشاؤها بواسطة هذه الورقة. تم تحقيق الدقة التنبؤية البالغة 93.33 ٪ و 88.26 ٪ على التوالي ، تفوقت على جميع نماذج التصنيف الحديثة السابقة.
يوليو 2020: Prottrans: نحو تكسير لغة كود الحياة من خلال التعلم الخاضع للإشراف ذاتيًا. preprint ، المعلوماتية الحيوية. Elnaggar ، A. ، M. Heinzinger ، C. Dallago ، G. Reshawi ، Y. Wang ، L. Jons ، T. Gibbs ، T. Feher ، C. Angerer ، M. Steinegger ، D. Bhowmik ، and B. Rost (2020 ، July). https://www.biorxiv.org/content/10.1101/2020.07.12.199554v1.full.pdf
تحديث: يوليو 2021: بروتترانس: نحو تكسير لغة كود الحياة من خلال التعلم العميق الذي تم إشرافه ذاتيا وحساب عالي الأداء Elnaggar ، أحمد وهينزنجر ، مايكل ودالاغو ، كريستيان وريهوي ، غاليا ، يو ، وانغ ، وجونز ، و ". Burkhard https://ieeexplore.ieee.org/abstract/document/9477085
prottrans github: https://github.com/agemagician/prottrans