Recentemente, o ARC Institute e a Nvidia lançaram em conjunto o maior modelo de inteligência artificial biológica do mundo - EVO2, juntamente com equipes de pesquisa da Universidade de Stanford, UC Berkeley e UC São Francisco. Com base em dados de mais de 128.000 genomas, esse modelo inovador treinou 9,3 trilhões de nucleotídeos, comparável ao mais poderoso modelo de idioma de IA generativa, marcando um grande salto no campo da pesquisa de biologia.
A profunda capacidade de aprendizado do EVO2 permite identificar rapidamente padrões em sequências de genes de diferentes organismos, reduzindo bastante as horas de trabalho dos pesquisadores. Esse modelo não apenas reconhece com precisão mutações que desencadeiam doenças humanas, mas também projeta novos genomas comparáveis ao comprimento de um genoma bacteriano simples. A equipe de desenvolvimento planeja lançar detalhes do EVO2 em 19 de fevereiro de 2025 e lançar uma interface amigável chamada EVO Designer. Além disso, o código da EVO2 foi publicado no GitHub da ARC e integrado à estrutura de Bionemo da NVIDIA para promover mais pesquisas científicas.
Comparado com o modelo de geração anterior EVO1, o EVO2 expandiu significativamente sua faixa de dados, cobrindo dados de bactérias, archaea, vírus e eucariotos, como seres humanos e plantas. Os pesquisadores disseram que o desenvolvimento do EVO2 marca um marco importante no campo da biologia generativa, que permite que as máquinas "leiam, escrevam, pensem" a linguagem dos nucleotídeos, fornecendo novas possibilidades para futuras bioengenharia e design de terapia genética.
No nível técnico, o EVO2 foi treinado na plataforma NVIDIA DGX Cloud AI e usou mais de 2.000 GPUs NVIDIA H100. Esse poderoso poder de computação permite que o modelo processe até 1 milhão de nucleotídeos por vez, assim uma melhor compreensão das relações entre partes remotas do genoma. A nova arquitetura da IA "StripedHyena2" permite que o EVO2 processe 30 vezes mais dados do que o EVO1, melhorando ainda mais seu desempenho.
O EVO2 possui uma ampla gama de aplicações, especialmente na análise de alterações genéticas relacionadas à função proteica e adaptabilidade do organismo. Por exemplo, em testes variantes do gene BRCA1 relacionado ao câncer de mama, o EVO2 prevê mutações com mais de 90%. Essas descobertas não apenas economizarão muito tempo e fundos de laboratório, mas também acelerarão o desenvolvimento de novos medicamentos.
Além disso, o EVO2 pode ajudar a projetar novas ferramentas biológicas ou opções de tratamento. Por exemplo, os cientistas podem usar o modelo para projetar terapias genéticas direcionadas a células específicas para evitar efeitos colaterais. A equipe de pesquisa acredita que, no futuro, modelos de IA mais específicos podem ser construídos com base no EVO2, fornecendo mais possibilidades de pesquisa genômica e bioengenharia.
Em termos de riscos éticos e de segurança, os pesquisadores garantem que o conjunto de dados da EVO2 não contenha patógenos que sejam prejudiciais aos seres humanos e outros organismos complexos para desenvolver e implantar com responsabilidade a tecnologia. Esse movimento não apenas garante a segurança da tecnologia, mas também estabelece uma base sólida para futuras pesquisas biológicas.
A introdução detalhada do EVO2 pode ser encontrada no seguinte link: https://arcinstitute.org/news/blog/evo2
Pontos -chave: EVO2 é o maior modelo de IA biológico do mundo, com dados de treinamento cobrindo 128.000 genomas. Esse modelo pode identificar rapidamente mutações de doenças e projetar novos genomas, melhorando bastante a eficiência da pesquisa científica. O EVO2 oferece novas possibilidades para futuras bioengenharia e design de terapia genética.