ตอนนี้ตีพิมพ์ใน Oxford Academic - Bioinformatics Advances
https://academic.oup.com/bioinformaticsadvances/article/2/1/vbac021/6561563
เปปไทด์ต้านจุลชีพ (แอมป์) มีการใช้มากขึ้นในการพัฒนายารักษาโรคใหม่ในพื้นที่เช่นการรักษาโรคมะเร็งและความดันโลหิตสูง นอกจากนี้พวกเขาจะถูกมองว่าเป็นทางเลือกแทนยาปฏิชีวนะเนื่องจากการเพิ่มขึ้นของการดื้อยาแบคทีเรียที่เพิ่มขึ้น อย่างไรก็ตามการระบุการทดลองแบบ Wetlaboratory นั้นใช้เวลานานและมีค่าใช้จ่ายสูงดังนั้นแบบจำลอง in-silico จึงใช้กันทั่วไปเพื่อคัดกรองผู้สมัคร AMP ใหม่ บทความนี้เสนอวิธีการใหม่ในการสร้างอินพุตแบบจำลอง การใช้แบบจำลองภาษาที่ผ่านการฝึกอบรมมาก่อนเพื่อสร้างการฝังบริบทที่เป็นตัวแทนของกรดอะมิโนภายในแต่ละลำดับเปปไทด์ก่อนที่จะได้รับการฝึกฝนให้เป็นเครือข่ายประสาท แบบจำลองที่ดีที่สุดได้รับการตรวจสอบความถูกต้องในชุดข้อมูลสองชุดซึ่งเป็นแบบที่ใช้ก่อนหน้านี้ในการวิจัยการทำนาย AMP และชุดข้อมูลอิสระที่สร้างขึ้นโดยบทความนี้ ความแม่นยำในการทำนายของ 93.33% และ 88.26% นั้นทำได้ตามลำดับซึ่งมีประสิทธิภาพสูงกว่าแบบจำลองการจำแนกประเภทที่ทันสมัยก่อนหน้านี้ทั้งหมด
กรกฎาคม 2563: Prottrans: การถอดรหัสภาษาของรหัสชีวิตผ่านการเรียนรู้ที่ดูแลตนเอง preprint, ชีวสารสนเทศศาสตร์ Elnaggar, A. , M. Heinzinger, C. Dallago, G. Rehawi, Y. Wang, L. Jones, T. Gibbs, T. Feher, C. Angerer, M. Steinegger, D. Bhowmik และ B. Rost (2020, กรกฎาคม) https://www.biorxiv.org/content/10.1101/2020.07.12.199554V1.full.pdf
UPDATE: กรกฎาคม 2021: Prottrans: ไปสู่การถอดรหัสภาษาของรหัสชีวิตผ่านการเรียนรู้อย่างลึกซึ้งและการคำนวณประสิทธิภาพสูง Elnaggar, Ahmed และ Heinzinger, Michael และ Dallago, Christian และ Rehawi, Ghalia และ Yu, Wang และ Jones, Llion และ Gibbs Rost, Burkhard https://ieeexplore.ieee.org/abstract/document/9477085
Prottrans GitHub: https://github.com/agemagician/prottrans