Недавно ARC Institute и Nvidia совместно запустили крупнейшую в мире модель биологического искусственного интеллекта - Evo2, а также исследовательские команды из Стэнфордского университета, Калифорнийского университета в Беркли и Калифорнийском университете в Сан -Франциско. Основываясь на данных более чем 128 000 геномов, эта прорывная модель подготовила 9,3 триллиона нуклеотидов, сравнимые с наиболее мощной генеративной моделью языка ИИ в настоящее время, отмечая основной скачок в области биологических исследований.
Глубокое обучение EVO2 позволяет быстро идентифицировать закономерности в последовательностях генов разных организмов, значительно сокращая рабочие часы исследователей. Эта модель не только точно распознает мутации, которые запускают заболевания человека, но также разрабатывают новые геномы, которые сопоставимы с длиной простого бактериального генома. Команда разработчиков планирует выпустить подробности EVO2 19 февраля 2025 года и запустить удобный интерфейс под названием Evo Designer. Кроме того, код EVO2 был опубликован на GitHub ARC и интегрирован в рамку NVIDIA Bionemo для продвижения дальнейших научных исследований.
По сравнению с моделью предыдущего поколения EVO1, EVO2 значительно расширил свой диапазон данных, охватывая данные бактерий, археи, вирусов и эукариот, таких как люди и растения. Исследователи заявили, что разработка EVO2 отмечает важную веху в области генеративной биологии, которая позволяет машинам «читать, писать, думать» язык нуклеотидов, предоставляя новые возможности для будущего биоинженерии и дизайна генной терапии.
На техническом уровне EVO2 был обучен на платформе NVIDIA DGX Cloud AI и использовал более 2000 графических процессоров NVIDIA H100. Эта мощная вычислительная мощность позволяет модели обрабатывать до 1 миллиона нуклеотидов одновременно, тем самым лучше понимать отношения между отдаленными частями генома. Новая архитектура искусственного интеллекта "StripedHyena2" позволяет EVO2 обрабатывать в 30 раз больше данных, чем Evo1, что еще больше улучшит ее производительность.
EVO2 имеет широкий спектр применений, особенно при анализе генетических изменений, связанных с функцией белка и адаптивностью организма. Например, в вариантных тестах гена, связанного с раком молочной железы BRCA1, EVO2 предсказывает мутации с более чем 90%. Эти выводы не только значительно сэкономит лабораторное время и средства, но также ускорят разработку новых лекарств.
Кроме того, Evo2 может помочь разработать новые биологические инструменты или варианты лечения. Например, ученые могут использовать модель для разработки генной терапии, нацеленной на конкретные клетки, чтобы избежать побочных эффектов. Исследовательская группа считает, что в будущем более конкретные модели ИИ могут быть построены на основе EVO2, предоставляя больше возможностей для геномных исследований и биоинженерии.
С точки зрения этических рисков и рисков безопасности, исследователи гарантируют, что набор данных Evo2 не содержит патогенных микроорганизмов, которые вредны для людей и других сложных организмов для ответственности и развертывания технологии. Этот шаг не только обеспечивает безопасность технологий, но и закладывает прочную основу для будущих биологических исследований.
Подробное введение EVO2 можно найти по следующей ссылке: https://arcinstitute.org/news/blog/evo2
Ключевые моменты: Evo2 является крупнейшей в мире биологической моделью ИИ, с учебными данными, охватывающими 128 000 геномов. Эта модель может быстро идентифицировать мутации заболевания и разработать новые геномы, значительно повышая эффективность научных исследований. Evo2 предлагает новые возможности для будущего биоинженерии и дизайна генной терапии.