A "técnica de leitura da mente" nos filmes de ficção científica parece estar se tornando uma realidade! Cientistas da Universidade de Yale, Dartmouth College e Cambridge University desenvolveram em conjunto um modelo de IA chamado Mindllm que pode decodificar diretamente sinais cerebrais digitalizados por ressonância magnética funcional (fMRI) em texto humano-entendido. Essa tecnologia inovadora faz as pessoas suspirar que o futuro chegou silenciosamente.
Transformar atividades cerebrais complexas em palavras sempre foi um enorme desafio no campo da neurociência, e é tão difícil quanto escalar o Monte Everest. Técnicas anteriores tinham previsões ruins ou só podiam lidar com tarefas simples e tinham quase zero versatilidade entre os sujeitos. No entanto, o surgimento de Mindllm mudou completamente essa situação.

Mindllm é como um "super tradutor" que não apenas entende as atividades do cérebro, mas também converte -o em palavras sem ser restrito pelo sujeito e pelo sujeito. Esse avanço é graças à tecnologia de ajuste de instrução cerebral (BIT) desenvolvida pelos pesquisadores, o que permite que a Mindllm capture com mais precisão informações semânticas em sinais de ressonância magnética, melhorando bastante os recursos de decodificação.
Nos testes reais, o desempenho de Mindllm foi incrível. Entre as várias fMRI das tarefas de texto, seu desempenho excede em muito todos os modelos anteriores, com as tarefas a jusante melhoradas em 12,0%, a capacidade de generalização dos tópicos desconhecidos aumentou 16,4%e a adaptabilidade de novas tarefas aumentou 25,0%. O desempenho desse "mestre acadêmico geral", sem dúvida, abriu novas possibilidades para a tecnologia de interface do cérebro-computador.

Mindllm tem uma ampla perspectiva de aplicação. Para pacientes com distúrbios linguísticos, como afasia e colo do útero amiotrófico, espera -se que os ajudem a recuperar sua capacidade de se expressar e se reconectar com o mundo. Para pessoas saudáveis, a Mindllm também abriu as portas para os dispositivos digitais de "controle da mente" e se está controlando a IA ou controlando próteses, ela se tornará mais natural e humana.
O sucesso da Mindllm é inseparável do seu design "interno e externo". Ele usa um codificador de fMRI independente de sujeito que extrai com precisão os principais recursos da atividade cerebral de sinais complexos de fMRI e é adequado para diferentes assuntos. Ao mesmo tempo, está equipado com um grande modelo de idioma (LLM), que pode converter suavemente os recursos de EEG extraídos em linguagem humana.
Para melhorar ainda mais a precisão e a versatilidade da decodificação, os pesquisadores também desenvolveram a tecnologia de ajuste de instrução cerebral (BIT). Através das imagens como mediação, a Mindllm pode aprender várias tarefas, incluindo percepção, memória, linguagem e raciocínio, melhorando de maneira abrangente o entendimento das informações semânticas do cérebro.
Em testes rigorosos, a Mindllm teve um desempenho muito além das expectativas, não apenas superando o modelo de linha de base em todos os indicadores, mas também efetivamente adaptados a várias novas tarefas, mostrando uma plasticidade e flexibilidade incríveis. Além disso, os pesquisadores também analisaram o mecanismo de atenção da Mindllm em profundidade e descobriram que seu processo de tomada de decisão é interpretável, o que fornece informações valiosas sobre como o cérebro funciona.
O nascimento de Mindllm é sem dúvida um avanço marco da fmri para a decodificação de texto. Ele não apenas melhora muito a precisão e a universalidade da decodificação, mas também acende a imaginação infinita para o desenvolvimento futuro da tecnologia de interface do cérebro-computador. Talvez em um futuro próximo, "interpretação de idéias" não seja mais uma cena nos filmes de ficção científica, mas realmente entrará em nossas vidas e abrirá uma nova era de interação humano-computador.
Link em papel: https://arxiv.org/abs/2502.15786