地質科学の分野では、地質図は地球の表面と地下の構造を理解するための重要なツールです。ただし、これらの複雑なチャートを解釈するには、専門知識と豊富な経験が必要です。この分野でのインテリジェンスレベルを改善するために、Microsoft Research Asiaは最近、地質マップ理解におけるマルチモーダル大言語モデル(MLLMS)のパフォーマンスを評価するために特別に使用される新しいベンチマークセットGeomap-Benchを立ち上げました。
Geomapベンチの発売は、地質図の解釈のための人工知能の適用における重要なステップです。 Microsoftの研究者は、中国の地質科学アカデミーおよびWuhan大学の専門家と詳細な議論を行い、地質図の理解に必要な5つの重要な能力を決定しました:情報抽出、ポジショニング、参照、推論、分析。これらの機能は、基本情報の取得から複雑な論理タスクの実行まで、複数の側面をカバーし、AIが地質マップを包括的に理解していることを保証します。

7,000を超える地質マップを使用して、研究者はGeomap-Benchを作成し、標準的な回答で3,000を超える質問を生成し、地質図の解釈における既存のマルチモーダルモデルの制限を評価しました。一般的な課題には、高解像度画像の処理、ドメイン知識の必要性、多様な視覚表現が含まれます。

地質図のインテリジェントな分析をさらに促進するために、MicrosoftはGeomap-Agentも開発しました。これは、地質学的地図をデジタル化する能力を持つだけでなく、高解像度の画像処理とドメインナレッジアプリケーションでも大幅に改善されています。 Geomap-Agentアーキテクチャには、階層情報抽出、ドメインナレッジインジェクション、迅速な質問と回答の強化の3つのコアモジュールが含まれています。これらのモジュールの組み合わせにより、AIは複雑な地質情報を効率的かつ正確に分析できます。
研究者は、Geomap-BenchとGeomap-Agentの発売は、地質学の分野でのAIアプリケーションの新しい研究基盤を提供するだけでなく、地質情報のデジタル化と知性を大いに促進し、災害警告やリソースの探査などのより広い範囲の分野に広範囲に影響を与えると述べました。