المصنف التطوري القائم على التعلم العميق لتسلسل جليكان
يوفر هذا المستودع رمزًا لبوجار وآخرون ، 2020
يتم تشكيل الجليكانيين ، البوليمر الحيوي الأكثر تنوعًا وحاسمًا للعديد من العمليات البيولوجية ، من خلال ضغوط تطورية ناتجة بشكل خاص من تفاعلات الممرض المضيف. في حين أن هذا يضع الجليكان ضروريًا لفهم واستهداف تفاعلات المهرجان المضيف ، إلا أن تنوعهم الكبير ونقص الأساليب قد أدى إلى تعزيز التقدم حتى الآن في الاستفادة من إمكاناتهم التنبؤية. هنا ، نستخدم مجموعة بيانات منسقة من 12،674 جليكان من 1726 نوعًا لتطوير وتطبيق طرق التعلم الآلي لاستخراج المعلومات التطورية من الجليكان. يوفر نموذج اللغات العميق القائم على التعلم Sweetorigins تمثيلات Glycan المستنيرة التي نستخدمها لاكتشاف والتحقيق في الأشكال المستخدمة في التهرب المناعي بوساطة التقليد الجزيئي من قبل المشاركين ومسببات الأمراض. تمكننا أساليب محاذاة جليكان الجديدة من تحديد وإضفاء سياق على زخارف تحديد الفراوعة في السكاريد الكابسي للمكورات العنقودية الذهبية والسينيتوباكتر بوماني. علاوة على ذلك ، نوضح أن الأشجار التطورية القائمة على الجليكان تحتوي على معظم المعلومات الموجودة في السلالات التقليدية القائمة على الرنا الريباسي 16S وتحسين تمايز الأنواع ذات الصلة وثيقة الوثيقة ولكن المتباينة من الناحية الظاهرية ، مثل Bacillus cereus و Bacillus Anthracis. إن الاستفادة من المعلومات التطورية المتأصلة في الجليكان مع منهجية التعلم الآلي على استعداد لتوفير مزيد من الرؤى المطلوبة بشكل نقدي-في تفاعلات الممرض المضيف ، وعلاقات التسلسل إلى الوظيفة ، والتأثير الرئيسي للجليكان على اللدونة المظهرية.
يمكن العثور على جميع البيانات المستخدمة لهذا المشروع في الجداول التكميلية المرتبطة بالمخطوطة المرتبطة. يحتوي دفتر Jupyter المشروح في هذا المستودع على رمز مستخدم للتدريب على النموذج وتحليله وتوليد أرقام من المخطوطة. قم بتشغيل دفتر الملاحظات بالترتيب المقدم لتجنب الأخطاء. يمكن العثور على النماذج المدربة في المستودع ، ومع وظائف المساعد ، يمكن استخدامها للتنبؤ بالفئة التصنيفية لتسلسل الجليكان الجديد. المزيد من الأدوات المتاحة على https://wyss.shinyapps.io/glycobase/.