非標的メタボロミクスは、精密医学とバイオマーカーの発見の波に重要な役割を果たします。ただし、既存のスペクトル参照ライブラリの不完全性により、化合物の識別は依然として困難です。この問題を解決するために、ドイツ連邦材料研究研究所(BAM)と無料のベルリン大学の研究チームは、質量分析認識の精度を改善するためにタンデム質量分析のプロセスをシミュレートするように設計されたオープンソースグラフニューラルネットワーク(GNN)であるFioraを共同で開発しました。
Fioraモデルのコアは、分子内の結合の局所近隣情報を使用して化合物の破壊パターンを学習し、それによって断片化されたイオンの確率を導き出すことです。従来のフラグメンテーションアルゴリズムIcebergおよびCFM-IDと比較して、Fioraは品質予測に優れたパフォーマンスを発揮し、保持時間(RT)や衝突断面(CCS)などの他の機能を予測できます。この先駆的な研究結果は、2025年3月7日にNature Communicationsで公開されました。

Fioraの設計は、高性能GPUを最大限に活用し、推定の複合注釈を迅速に検証し、高品質の予測でスペクトル参照ライブラリを大幅に拡張します。この進歩は、特に未知の化合物を分析する場合、非標的メタボロミクスに関する研究を促進するために非常に重要です。この分野での研究は、高品質の参照スペクトルが不足しているため、過去10年間で遅くなっています。たとえば、2016 CASMIチャレンジは、コンピューターシミュレーション方法のリコール率はわずか34%であることを示しましたが、2022年には30%ではありませんでした。これは、新しいソリューションの緊急の必要性を示しています。
Fioraは、各化合物の局所構造に基づいて結合解離イベントを独立して評価できるという点でユニークです。この方法は、多くの既存のアルゴリズムよりも、質量分析の物理的断片化プロセスを直接シミュレートします。さらに、フィオラは、同様の化合物を標的とするときにうまく機能するだけでなく、なじみのない構造を促進する能力も印象的です。
その有効性を確保するために、Fioraは複数のデータセットでテストし、結果は、その予測される質量スペクトルと参照スペクトルの類似性の中央値が0.8以上に達し、場合によっては競合アルゴリズムよりも10%から49%高いことを示しました。さらに、Fioraのモジュラー設計により、さまざまな予測目標に柔軟に適応することができ、優れた汎用性を示しています。
Fioraの発売は、質量分析分析のギャップを埋めるだけでなく、将来の化合物の識別と研究のための強力なツールも提供します。