Kürzlich haben ARC Institute und Nvidia gemeinsam das weltweit größte biologische künstliche Intelligenzmodell - EVO2, zusammen mit Forschungsteams der Stanford University, der UC Berkeley und der UC San Francisco ins Leben gerufen. Basierend auf Daten aus mehr als 128.000 Genomen trainierte dieses Durchbruchmodell 9,3 Billionen Nukleotide, vergleichbar mit dem derzeit leistungsstärksten generativen AI -Sprachmodell, der einen Hauptsprung im Bereich der Biologieforschung markiert.
Die Deep -Lern -Fähigkeit von EVO2 ermöglicht es ihm, Muster in Gensequenzen verschiedener Organismen schnell zu identifizieren und die Arbeitszeiten der Forscher erheblich zu verringern. Dieses Modell erkennt nicht nur Mutationen, die menschliche Krankheiten auslösen, sondern entwirft auch neue Genome, die mit der Länge eines einfachen bakteriellen Genoms vergleichbar sind. Das Entwicklungsteam plant, am 19. Februar 2025 Details von EVO2 zu veröffentlichen und eine benutzerfreundliche Schnittstelle namens EVO Designer zu starten. Darüber hinaus wurde der Code von EVO2 auf dem ARC -GitHub veröffentlicht und in den Bionemo -Framework von Nvidia integriert, um weitere wissenschaftliche Forschung zu fördern.
Im Vergleich zum Modell der vorherigen Generation EVO1 hat EVO2 seinen Datenbereich erheblich erweitert und Daten aus Bakterien, Archaea, Viren und Eukaryoten wie Menschen und Pflanzen abdeckt. Die Forscher sagten, die Entwicklung von EVO2 ist ein wichtiger Meilenstein im Bereich der Generativbiologie, mit dem Maschinen die Sprache der Nukleotide „lesen, schreiben, denken“ und neue Möglichkeiten für zukünftige Bioengineering und Gentherapiedesign bieten.
Auf technischer Ebene wurde EVO2 auf der NVIDIA DGX Cloud AI -Plattform trainiert und verwendet mehr als 2.000 NVIDIA H100 GPUs. Diese leistungsstarke Rechenleistung ermöglicht es dem Modell, jeweils bis zu 1 Million Nukleotide zu verarbeiten, wodurch die Beziehungen zwischen entfernten Teilen des Genoms besser verstanden werden. Die neue AI -Architektur "StripedHyena2" ermöglicht es EVO2, 30 -mal mehr Daten als EVO1 zu verarbeiten, wodurch die Leistung weiter verbessert wird.
EVO2 hat eine Vielzahl von Anwendungen, insbesondere bei der Analyse genetischer Veränderungen im Zusammenhang mit der Proteinfunktion und der Anpassungsfähigkeit des Organismus. Beispielsweise prognostiziert EVO2 in varianten Tests des Brustkrebs-Gens BRCA1 Mutationen mit mehr als 90%. Diese Ergebnisse werden nicht nur die Laborzeit und -fonds stark sparen, sondern auch die Entwicklung neuer Medikamente beschleunigen.
Darüber hinaus kann EVO2 dazu beitragen, neue biologische Werkzeuge oder Behandlungsoptionen zu entwerfen. Zum Beispiel könnten Wissenschaftler das Modell verwenden, um Gentherapien auf bestimmte Zellen zu entwerfen, um Nebenwirkungen zu vermeiden. Das Forschungsteam ist der Ansicht, dass in Zukunft spezifischere KI -Modelle auf der Grundlage von EVO2 aufgebaut werden können und mehr Möglichkeiten für die genomische Forschung und Bioengineering bieten.
In Bezug auf ethische und Sicherheitsrisiken stellen die Forscher sicher, dass der Datensatz von EVO2 keine Krankheitserreger enthält, die für Menschen und andere komplexe Organismen schädlich sind, um die Technologie verantwortungsbewusst zu entwickeln und bereitzustellen. Dieser Schritt gewährleistet nicht nur die Sicherheit der Technologie, sondern bildet auch eine solide Grundlage für die zukünftige biologische Forschung.
Die detaillierte Einführung von EVO2 finden Sie unter dem folgenden Link: https://arcinstitute.org/news/blog/evo2
Schlüsselpunkte: EVO2 ist das weltweit größte biologische KI -Modell mit Trainingsdaten, die 128.000 Genome abdecken. Dieses Modell kann schnell Krankheitsmutationen identifizieren und neue Genome entwerfen und die wissenschaftliche Forschungseffizienz erheblich verbessern. EVO2 bietet neue Möglichkeiten für zukünftige Bioengineer- und Gentherapiedesign.