Mini-Gemini: マルチモーダル視覚言語モデルを強化するシンプルで効果的な AI フレームワーク
香港中文大学と SmartMore の研究者は、デュアル エンコーダ システムとパッチ情報マイニング テクノロジーを通じて VLM の開発を進めるために、Mini-Gemini と呼ばれる新しいフレームワークを導入しました。 Mini-Gemini は複数のゼロショット ベンチマークで良好なパフォーマンスを示し、既存のモデルを上回ります。フレームワークはデュアルエンコーダーシステムを使用しています
2025-02-20














