A metabolômica não direcionada desempenha um papel crucial na onda de medicina de precisão e descoberta de biomarcadores. No entanto, a identificação de compostos permanece desafiadora devido à incompletude da biblioteca de referência de espectro existente. Para resolver esse problema, o Instituto Federal de Pesquisa e Teste de Materiais Alemão (BAM) e uma equipe de pesquisa da Universidade de Berlim gratuita desenvolveram em conjunto a FIORA, uma rede neural gráfica de código aberto (GNN), projetado para simular o processo de espectrometria de massa em tandem para ajudar a melhorar a precisão do reconhecimento da espectrometria de massa.
O núcleo do modelo FIORA é que ele usa informações locais da vizinhança de títulos em moléculas para aprender os padrões de ruptura dos compostos, derivando assim a probabilidade de íons fragmentados. Comparado com os algoritmos tradicionais de fragmentação iceberg e CFM-ID, o FIORA tem um desempenho excelente em previsão de qualidade e pode prever outros recursos, como tempo de retenção (RT) e seção transversal de colisão (CCS). Esse resultado pioneiro na pesquisa foi publicado na Nature Communications em 7 de março de 2025.

O design da FIORA faz pleno uso de GPUs de alto desempenho, validar rapidamente anotações compostas putativas e expande significativamente a biblioteca de referência espectral com previsões de alta qualidade. Esse progresso é de grande importância para promover pesquisas sobre metabolômica não direcionada, especialmente ao analisar compostos desconhecidos. A pesquisa nesse campo tem sido lenta na última década devido à escassez de espectro de referência de alta qualidade. Por exemplo, o desafio do CASMI de 2016 mostrou que a taxa de recall dos métodos de simulação de computador era de apenas 34%, enquanto não era de 30% em 2022. Isso mostra a necessidade urgente de uma nova solução.
O FIORA é único, pois pode avaliar independentemente os eventos de dissociação de títulos com base na estrutura local de cada composto. Este método simula o processo de fragmentação física na espectrometria de massa mais diretamente do que muitos algoritmos existentes. Além disso, o FIORA não apenas tem um bom desempenho ao atingir compostos semelhantes, mas também sua capacidade de promover estruturas desconhecidas é impressionante.
Para garantir sua eficácia, a FIORA testada em vários conjuntos de dados e os resultados mostraram que a similaridade mediana entre seus espectros de massa prevista e o espectro de referência atingiu mais de 0,8 e, em alguns casos, 10% a 49% maior que o algoritmo de competição. Além disso, o design modular da FIORA permite se adaptar de maneira flexível a diferentes objetivos preditivos, mostrando excelente versatilidade.
O lançamento da FIORA não apenas preenche a lacuna na análise de espectrometria de massa, mas também fornece uma ferramenta poderosa para futuras identificação e pesquisa compostos.