في الآونة الأخيرة ، أطلقت معهد ARC و NVIDIA بشكل مشترك أكبر نموذج للذكاء الاصطناعي البيولوجي في العالم - EVO2 ، مع فرق البحث من جامعة ستانفورد ، جامعة كاليفورنيا في بيركلي ، جامعة كاليفورنيا في سان فرانسيسكو. استنادًا إلى بيانات من أكثر من 128000 جينوم ، قام هذا النموذج المتقدم بتدريب 9.3 تريليون نيوكليوتيدات ، مماثلة لأقوى نموذج لغة AI التوليدي في الوقت الحالي ، مما يمثل قفزة كبيرة في مجال أبحاث البيولوجيا.
تتيح قدرة التعلم العميق لـ EVO2 تحديد الأنماط بسرعة في تسلسل الجينات من الكائنات الحية المختلفة ، مما يقلل بشكل كبير من ساعات العمل للباحثين. لا يتعرف هذا النموذج بدقة على الطفرات التي تؤدي إلى الأمراض البشرية فحسب ، بل يقوم أيضًا بتصميم جينومات جديدة يمكن مقارنتها بطول الجينوم البكتيري البسيط. يخطط فريق التطوير لإصدار تفاصيل EVO2 في 19 فبراير 2025 وإطلاق واجهة سهلة الاستخدام تسمى EVO Designer. بالإضافة إلى ذلك ، تم نشر رمز EVO2 على Github's ARC ودمج في إطار Bionemo من NVIDIA لتعزيز المزيد من البحوث العلمية.
بالمقارنة مع نموذج الجيل السابق EVO1 ، قام EVO2 بتوسيع نطاق البيانات بشكل كبير ، والذي يغطي البيانات من البكتيريا ، الأركية ، الفيروسات ، وذاكرة حقيقيات النوى مثل البشر والنباتات. وقال الباحثون إن تطوير EVO2 يمثل علامة فارقة مهمة في مجال البيولوجيا التوليدية ، والتي تمكن الآلات من "القراءة والكتابة والتفكير" في لغة النيوكليوتيدات ، مما يوفر إمكانيات جديدة لتصميم الهندسة الحيوية في المستقبل وتصميم الجينات.
على المستوى الفني ، تم تدريب EVO2 على منصة NVIDIA DGX Cloud AI واستخدمت أكثر من 2000 وحدة معالجة الرسومات NVIDIA H100. تتيح قوة الحوسبة القوية هذه النموذج من معالجة ما يصل إلى مليون نيوكليوتيدات في وقت واحد ، وبالتالي فهم أفضل للعلاقات بين الأجزاء النائية من الجينوم. تتيح بنية الذكاء الاصطناعي الجديد "StripedHyena2" EVO2 معالجة بيانات أكثر 30 مرة من EVO1 ، مما يؤدي إلى تحسين أدائها.
يحتوي EVO2 على مجموعة واسعة من التطبيقات ، خاصة في تحليل التغيرات الوراثية المتعلقة بوظيفة البروتين والقدرة على التكيف مع الكائن الحي. على سبيل المثال ، في الاختبارات المتغيرة للجين الجيني المتعلق بسرطان الثدي ، يتنبأ EVO2 بالطفرات بأكثر من 90 ٪. لن تنقذ هذه النتائج وقتًا وصناديقًا مختبريًا فحسب ، بل ستعمل أيضًا على تسريع تطوير عقاقير جديدة.
بالإضافة إلى ذلك ، يمكن أن يساعد EVO2 في تصميم أدوات بيولوجية أو خيارات علاجية جديدة. على سبيل المثال ، يمكن للعلماء استخدام النموذج لتصميم علاجات الجينات التي تستهدف خلايا معينة لتجنب الآثار الجانبية. يعتقد فريق البحث أنه في المستقبل ، يمكن بناء نماذج الذكاء الاصطناعى الأكثر تحديدًا على أساس EVO2 ، مما يوفر المزيد من الاحتمالات للبحوث الجينية والهندسة الحيوية.
فيما يتعلق بالمخاطر الأخلاقية والأمنية ، يضمن الباحثون أن مجموعة بيانات EVO2 لا تحتوي على مسببات الأمراض التي تضر بالبشر والكائنات المعقدة الأخرى لتطوير ونشر التكنولوجيا بمسؤولية. هذه الخطوة لا تضمن سلامة التكنولوجيا فحسب ، بل تضع أيضًا أساسًا متينًا للبحوث البيولوجية المستقبلية.
يمكن العثور على مقدمة مفصلة لـ EVO2 في الرابط التالي: https://arcinstitute.org/news/blog/evo2
النقاط الرئيسية: EVO2 هو أكبر نموذج بيولوجي في العالم ، مع بيانات التدريب التي تغطي 128000 جينوم. يمكن لهذا النموذج تحديد طفرات المرض بسرعة وتصميم جينومات جديدة ، وتحسين كفاءة البحث العلمي بشكل كبير. يوفر EVO2 إمكانيات جديدة لتصميم الهندسة الحيوية في المستقبل وعلاج الجينات.