科幻电影中的“读心术”似乎正在成为现实!耶鲁大学、达特茅斯学院和剑桥大学的科学家们联合开发了一款名为MindLLM的AI模型,能够将功能性磁共振成像(fMRI)扫描的大脑信号直接解码为人类可理解的文字。这一突破性技术让人不禁感叹,未来已经悄然来临。
将复杂的大脑活动转化为文字一直是神经科学领域的巨大挑战,难度堪比攀登珠穆朗玛峰。以往的技术要么预测效果不佳,要么只能处理简单的任务,且跨受试者的通用性几乎为零。然而,MindLLM的出现彻底改变了这一局面。

MindLLM就像一位“超级翻译官”,不仅能理解大脑的活动,还能将其转化为文字,且不受主题和受试者的限制。这一突破得益于研究人员开发的大脑指令调整(BIT)技术,该技术使MindLLM能够更精准地捕捉fMRI信号中的语义信息,从而大幅提升了解码能力。
在实际测试中,MindLLM的表现令人惊叹。在各种fMRI到文本的任务中,它的性能远超以往所有模型,下游任务性能提升了12.0%,未知主题泛化能力提升了16.4%,新任务适应能力更是暴增25.0%。这一“全能学霸”的表现无疑为脑机接口技术开辟了新的可能性。

MindLLM的应用前景极为广阔。对于失语症、渐冻症等语言障碍患者来说,它有望帮助他们重新获得表达的能力,与世界重新建立连接。对于健康人群,MindLLM也为“意念控制”数字设备打开了大门,无论是操控AI还是控制假肢,都将变得更加自然和人性化。
MindLLM的成功离不开其“内外兼修”的设计。它采用了主题无关的fMRI编码器,能够从复杂的fMRI信号中精准提取大脑活动的关键特征,且适用于不同受试者。同时,它还搭载了大型语言模型(LLM),能够将提取的脑电特征流畅地转化为人类语言。
为了进一步提升解码的准确性和通用性,研究人员还开发了大脑指令调整(BIT)技术。通过图像作为中介,MindLLM能够学习各种任务,包括感知、记忆、语言和推理等,从而全面提升对大脑语义信息的理解能力。
在严格的测试中,MindLLM的表现远超预期,不仅在各项指标上全面超越基线模型,还能有效适应各种新任务,展现出惊人的可塑性和灵活性。此外,研究人员还深入分析了MindLLM的注意力机制,发现其决策过程具有可解释性,这为我们进一步理解大脑的工作原理提供了宝贵的见解。
MindLLM的诞生无疑是fMRI到文本解码领域的里程碑式突破。它不仅大幅提升了解码的精度和泛用性,还为脑机接口技术的未来发展点燃了无限遐想。或许在不久的将来,“意念交流”将不再是科幻电影中的桥段,而是真真切切地走进我们的生活,开启人机交互的全新纪元。
论文链接:https://arxiv.org/abs/2502.15786