최근 ARC Institute와 NVIDIA는 생물학에서 복잡한 현상을 깊이 해독하는 것을 목표로 10 만 개 이상의 유기체의 DNA 데이터를 기반으로 한 획기적인 기술인 EVO2 생물학 AI 모델을 공동으로 발표했습니다. EVO2는 연구자들이 다른 유기체의 유전자 서열에서 발견하는 데 몇 년이 필요한 패턴을 식별하여 질병 관련 돌연변이의 인식을 크게 향상시키고 간단한 박테리아와 비슷한 완전히 새로운 게놈을 설계합니다. 이 기술의 출시는 생물 의학 연구의 새로운 시대입니다.

EVO2의 훈련 과정은 93 조의 뉴클레오티드를 처리하는 것을 포함하며, 이전 모델 EVO1을 훨씬 초과합니다. 개발 팀은 캘리포니아 팔로 알토에 본사를 둔 비영리 생물 의학 연구 기관인 Nvidia와 Arc Institute로 구성되며 Stanford University, UC Berkeley 및 UC San Francisco의 연구원들과 긴밀히 협력합니다. EVO2는 컴퓨팅 성능에 탁월 할뿐만 아니라 투명성과 해석 성을 적극적으로 탐색합니다. 과학 연구의 공개 공유를 촉진하기 위해 연구팀은 EVO2의 교육 데이터, 코드 및 모델 가중치를 공개하여 현재까지 가장 큰 오픈 소스 생물학적 AI 모델이되었습니다.

UC Berkeley의 ARC Institute의 공동 창립자이자 조교수 인 Patrick HSU는 EVO2의 개발이 생성 생물학 분야에서 중요한 돌파구라고 말했다. 이 기술을 통해 기계는 뉴클레오티드의 언어를 "읽기", "쓰기"및 "생각"할 수 있으며, 이는 생물학적 연구의 진행을 크게 촉진합니다. EVO2의 훈련 능력은 대규모 언어 모델과 비교하여 질병 돌연변이를 예측하고 잠재적 인 인공 생활을 설계 할 때 강력한 잠재력을 보여줍니다.
또한 EVO2는 생물학적 요법 설계를위한 새로운 아이디어를 제공합니다. 예를 들어, 특정 세포 유형에 의해 활성화 된 유전자 요법을 표적으로하여 부작용을 줄이고 치료 정확도를 향상시킬 수있다. EVO2의 개발은 기술 혁신을 달성했을뿐만 아니라 생물학에 대한 이해에 큰 영향을 미쳤다.
모델의 책임있는 개발을 보장하기 위해 연구원들은 의도적으로 인간과 다른 복잡한 유기체를 감염시키는 병원체에 대한 데이터를 배제했습니다. NVIDIA의 디지털 생물학 이사 인 Anthony Costa는 EVO2가 기본 생물학적 모델의 한계를 뛰어 넘고 전 세계 과학자들에게 인간이 직면 한 주요 건강 및 질병 문제를 해결하기위한 강력한 공동 작업 도구를 제공한다고 말했다. 이 기술은 광범위한 응용 전망을 가지고 있으며 향후 생물 의학 연구에서 중요한 역할을 할 것으로 예상됩니다.