Ahora publicado en Oxford Academic - Bioinformatics Advances
https://academic.oup.com/bioinformaticsadvances/article/2/1/vbac021/6561563
Los péptidos antimicrobianos (AMP) se utilizan cada vez más en el desarrollo de nuevos fármacos terapéuticos, en áreas como la terapia del cáncer y la hipertensión. Además, son vistos como una alternativa a los antibióticos debido a la creciente aparición de resistencia bacteriana. Sin embargo, la identificación experimental de WetLaboratoratoratory tiene mucho tiempo y es costoso, por lo que los modelos en silicio ahora se usan comúnmente para detectar nuevos candidatos de AMP. Este documento propone un enfoque novedoso para crear entradas de modelo; Uso de modelos de lenguaje previamente capacitados para producir incrustaciones contextualizadas que representan los aminoácidos dentro de cada secuencia de péptidos, antes de que una red neuronal convolucional se entrene como el clasificador. El modelo óptimo se validó en dos conjuntos de datos, siendo uno utilizado previamente en la investigación de predicción de AMP y un conjunto de datos independiente, creado por este documento. Las precisiones predictivas de 93.33% y 88.26% se lograron respectivamente, superando a todos los modelos de clasificación de última generación anteriores.
Julio de 2020: Prottrans: hacia el lenguaje del código de la vida a través del aprendizaje auto-supervisado. Preprint, bioinformática. Elnaggar, A., M. Heinzinger, C. Dallago, G. Rehawi, Y. Wang, L. Jones, T. Gibbs, T. Feher, C. Angerer, M. Steinergger, D. Bhowmik y B. Rost (2020, julio). https://www.biorxiv.org/content/10.1101/2020.07.12.199554v1.full.pdf
Update: July 2021: ProtTrans: Towards Cracking the Language of Life's Code Through Self-Supervised Deep Learning and High Performance Computing Elnaggar, Ahmed and Heinzinger, Michael and Dallago, Christian and Rehawi, Ghalia and Yu, Wang and Jones, Llion and Gibbs, Tom and Feher, Tamas and Angerer, Christoph and Steinegger, Martin and Bhowmik, Debsindhu and Rost, Burkhard https://ieeExplore.ieee.org/abstract/document/9477085
Prottrans Github: https://github.com/agemagician/prottrans