Récemment, Arc Institute et NVIDIA ont publié conjointement le modèle EVO2 Biological IA, une technologie révolutionnaire basée sur les données d'ADN de plus de 100 000 organismes, visant à décoder profondément les phénomènes complexes en biologie. EVO2 est capable d'identifier les modèles que les chercheurs ont besoin d'années pour découvrir dans les séquences génétiques de différents organismes, améliorant considérablement la reconnaissance des mutations liées à la maladie et concevant un génome complètement nouveau comparable aux bactéries simples. La sortie de cette technologie marque une nouvelle ère dans la recherche biomédicale.

Le processus de formation de EVO2 implique le traitement de plus de 93 billions de nucléotides, dépassant de loin son prédécesseur, EVO1. L'équipe de développement se compose de Nvidia et de l'Arc Institute, une organisation de recherche biomédicale à but non lucratif basée à Palo Alto, en Californie, et travaille en étroite collaboration avec des chercheurs de l'Université de Stanford, UC Berkeley et UC San Francisco. EVO2 excelle non seulement dans le pouvoir de calcul, mais explore également activement la transparence et l'interprétabilité. Pour promouvoir le partage ouvert de la recherche scientifique, l'équipe de recherche a révélé les données de formation, le code et le modèle d'EVO2, ce qui en fait le plus grand modèle d'IA biologique entièrement open source à ce jour.

Patrick HSU, co-fondateur de l'Arc Institute et professeur adjoint à UC Berkeley, a déclaré que le développement de EVO2 est une percée importante dans le domaine de la biologie générative. Grâce à cette technologie, les machines peuvent "lire", "écrire" et "penser" le langage des nucléotides, qui favorise considérablement les progrès de la recherche biologique. Les capacités de formation d'EVO2 sont comparables aux modèles de langage à grande échelle, montrant un fort potentiel dans la prévision des mutations de la maladie et la conception de la vie artificielle potentielle.
De plus, EVO2 fournit également de nouvelles idées pour la conception des thérapies biologiques. Par exemple, il peut cibler la thérapie génique activée par un type de cellule spécifique, réduisant ainsi les effets secondaires et améliorant la précision du traitement. Le développement de EVO2 a non seulement atteint des percées technologiques, mais a également eu un impact profond sur la compréhension de la biologie.
En garantissant le développement responsable du modèle, les chercheurs ont délibérément exclu les données sur les agents pathogènes qui infectent les humains et autres organismes complexes. Anthony Costa, directeur de la biologie numérique chez NVIDIA, a déclaré que EVO2 permettait des limites des modèles biologiques de base et fournit aux scientifiques du monde entier de puissants outils collaboratifs pour relever les principaux défis de la santé et de la maladie auxquels sont confrontés les humains. Cette technologie possède de vastes perspectives d'application et devrait jouer un rôle important dans la recherche biomédicale future.