近日,Arc Institute与Nvidia联合发布了Evo2生物AI模型,这一突破性技术基于超过10万种生物的DNA数据,旨在深度解码生物学中的复杂现象。 Evo2能够在不同生物体的基因序列中识别出研究者们需要多年才能发现的模式,显着提升了疾病相关突变的识别能力,并可以设计出与简单细菌相当的全新基因组。这一技术的发布标志着生物医学研究进入了一个全新的时代。

Evo2的训练过程涉及超过93万亿个核苷酸的处理,远超其前身Evo1。开发团队由Nvidia和位于加州帕洛阿尔托的非营利生物医学研究机构Arc Institute组成,并与斯坦福大学、加州大学伯克利分校和加州大学旧金山分校的研究人员密切合作。 Evo2不仅在计算能力上表现出色,还在透明性和可解释性方面做出了积极探索。为了推动科学研究的开放共享,研究团队公开了Evo2的训练数据、代码和模型权重,使其成为迄今为止最大规模的完全开源生物AI模型。

Arc Institute的共同创始人兼UC Berkeley助理教授Patrick Hsu表示,Evo2的开发是生成生物学领域的一次重要突破。通过这项技术,机器能够“阅读”、“写作”和“思考”核苷酸的语言,极大地推动了生物研究的进展。 Evo2的训练能力与大规模语言模型相媲美,显示出在预测疾病突变及设计潜在人工生命方面的强大潜力。
此外,Evo2还为生物疗法的设计提供了新思路。例如,它可以针对特定细胞类型激活的基因治疗,从而减少副作用并提高治疗精度。 Evo2的开发不仅在技术上实现了突破,同时也对生物学的理解产生了深远影响。
在确保模型的负责任开发过程中,研究人员特意排除了会感染人类及其他复杂生物的病原体数据。 Nvidia的数字生物学总监Anthony Costa表示,Evo2突破了生物基础模型的局限,为全球科学家提供了强大的合作工具,以应对人类面临的重大健康和疾病挑战。这一技术的应用前景广阔,有望在未来的生物医学研究中发挥重要作用。