최근 Arc Institute와 Nvidia는 Stanford University, UC Berkeley 및 UC San Francisco의 연구팀과 함께 세계 최대의 생물학적 인공 지능 모델 인 EVO2를 공동으로 시작했습니다. 128,000 개가 넘는 게놈의 데이터를 기반 으로이 획기적인 모델은 현재 가장 강력한 생성 AI 언어 모델과 비교할 수있는 9.3 조 뉴클레오티드를 훈련 시켰으며, 생물학 연구 분야에서 주요 도약을 표시했습니다.
EVO2의 딥 러닝 능력을 통해 다른 유기체의 유전자 서열에서 패턴을 신속하게 식별하여 연구원의 근무 시간을 크게 줄입니다. 이 모델은 인간 질병을 유발하는 돌연변이를 정확하게 인식 할뿐만 아니라 간단한 박테리아 게놈의 길이와 비슷한 새로운 게놈을 설계합니다. 개발 팀은 2025 년 2 월 19 일에 EVO2의 세부 정보를 발표하고 EVO Designer라는 사용자 친화적 인 인터페이스를 출시 할 계획입니다. 또한 EVO2의 코드는 ARC의 GitHub에 게시되었으며 추가 과학적 연구를 촉진하기 위해 NVIDIA의 Bionemo 프레임 워크에 통합되었습니다.
이전 세대 모델 EVO1과 비교하여 EVO2는 박테리아, 고고, 바이러스 및 인간 및 식물과 같은 진핵 생물의 데이터를 다루는 데이터 범위를 크게 확장했습니다. 연구원들은 EVO2의 개발이 생성 생물학 분야에서 중요한 이정표를 나타내며, 이는 기계가 뉴클레오티드의 언어를 "읽고 쓰고 쓰고, 생각"할 수있게하여 미래의 바이오 엔지니어링 및 유전자 치료 설계에 새로운 가능성을 제공 할 수 있다고 말했다.
기술 수준에서 EVO2는 NVIDIA DGX Cloud AI 플랫폼에서 교육을 받았으며 2,000 개 이상의 NVIDIA H100 GPU를 사용했습니다. 이 강력한 컴퓨팅 능력을 통해 모델은 한 번에 최대 1 백만 개의 뉴클레오티드를 처리 할 수 있으므로 게놈의 원격 부분 간의 관계를 더 잘 이해할 수 있습니다. 새로운 AI 아키텍처 "Stripedhyena2"는 EVO2가 EVO1보다 30 배 더 많은 데이터를 처리하여 성능을 향상시킬 수 있도록합니다.
EVO2는 특히 단백질 기능 및 유기체 적응성과 관련된 유전 적 변화의 분석에서 광범위한 응용을 갖는다. 예를 들어, 유방암 관련 유전자 BRCA1의 변형 검사에서 EVO2는 90%이상의 돌연변이를 예측합니다. 이러한 결과는 실험실 시간과 자금을 크게 절약 할뿐만 아니라 신약의 발달을 가속화 할 것입니다.
또한 EVO2는 새로운 생물 도구 또는 치료 옵션을 설계하는 데 도움이 될 수 있습니다. 예를 들어, 과학자들은 모델을 사용하여 부작용을 피하기 위해 특정 세포를 대상으로 한 유전자 요법을 설계 할 수 있습니다. 연구팀은 향후 EVO2를 기반으로보다 구체적인 AI 모델을 구축 할 수있어 게놈 연구 및 생물 공학에 더 많은 가능성을 제공 할 수 있다고 생각합니다.
윤리적 및 보안 위험 측면에서, 연구원들은 EVO2의 데이터 세트에 기술을 책임감있게 개발하고 배포하기 위해 인간 및 기타 복잡한 유기체에 유해한 병원체가 포함되어 있지 않도록합니다. 이러한 움직임은 기술의 안전을 보장 할뿐만 아니라 미래의 생물학적 연구를위한 견고한 토대를 임명합니다.
EVO2의 자세한 소개는 다음 링크에서 찾을 수 있습니다 : https://arcinstitute.org/news/blog/evo2
핵심 사항 : EVO2는 세계 최대의 생물학적 AI 모델이며 128,000 개의 게놈을 다루는 교육 데이터입니다. 이 모델은 질병 돌연변이를 신속하게 식별하고 새로운 게놈을 설계하여 과학적 연구 효율성을 크게 향상시킬 수 있습니다. EVO2는 미래의 생물 공학 및 유전자 요법 설계에 새로운 가능성을 제공합니다.