fiftyone multimodal rag pluginのダウンロード-FIFTONE fiftyone multimodal rag pluginインソースコードダウンロード

fiftyone multimodal rag plugin

その他のソースコード

1.0.0

ダウンロード

フィフティオン、llamaindex、およびmilvusを備えたマルチモーダルラグ

導入

検索拡張生成（RAG）は、大規模な言語モデルによって生成されるテキストの品質を改善する方法として、ますます人気が高まっています。マルチモーダルLLMがVougeになったので、マルチモーダルデータにRAGを拡張する時が来ました。

複数のモダリティでデータを検索および取得する機能を追加すると、今日利用可能な最も強力なAIモデルと対話するための強力なツールが得られます。ただし、プロセスに複雑さの新しい層も追加します。

考慮する必要がある考慮事項のいくつかは次のとおりです。

マルチモーダルデータをどのようにチャンクしてインデックスするのですか？私たちはそれを別々のモダリティに分割しますか、それとも一緒に保ちますか？
マルチモーダルデータをどのように検索しますか？各モダリティを個別に検索してから、結果を組み合わせますか、それとも一緒に検索しますか？
生成するデータの品質を改善するためにどのような新しい戦略を使用できますか？

より実用的なレベルでは、ここに私たちが回すことができる基本的なノブのいくつかがあります：

テキスト埋め込みモデル：テキストを埋め込むためにどのモデルを使用しますか？
画像表現：マルチモーダルモデル（クリップなど）で画像を埋め込んだり、キャプションを使用したりしますか？
取得したい画像とテキストの結果はいくつですか？
検索結果を生成するためにどのマルチモーダルモデルを使用していますか？

このプロジェクトは、これらの質問などを調査するためのテストベッドです。 Fiftyone、Llamaindex、およびMilvusの3つのオープンソースライブラリを使用して、マルチモーダルデータの操作、さまざまなマルチモーダルRAGテクニックの実験、可能な限り簡単に機能するものを見つけるプロセスを作成します。

ショ和このプロジェクトは進行中の作業です。それは端の周りで荒いかもしれません、そして、いくつかの機能は期待どおりに機能しないかもしれません。問題が発生した場合は、このリポジトリで問題を開いてください。またはさらに良いことに、プルリクエストを送信してください！

また、LlamainDexは頻繁にAPIを更新することに注意してください。これが、LlamainDexのバージョンとその関連パッケージがすべてピン留めされている理由です。

インストール

まず、FifToNEをインストールします：

pip install fiftyone

次に、FiftoneのCLI構文を使用して、Fiftone Multimodal Ragプラグインをダウンロードしてインストールします。

fiftyone plugins download https://github.com/jacobmarks/fiftyone-multimodal-rag-plugin

LlamainDexには、冗長インストールプロセスがあります（少なくともマルチモーダルを構築する場合）。幸いなことに、これ（および他のすべてのインストール依存関係）が次のコマンドで処理されます。

fiftyone plugins requirements @jacobmarks/multimodal_rag --install

使用法

設定

開始するには、Fiftyoneアプリを起動します。実行することでターミナルからそうすることができます。

fiftyone app launch

または、次のPythonコードを実行できます。

 import fiftyone as fo

session = fo . launch_app ()

マルチモーダルデータセットの作成

次に、バックティックキー（ ` ）を押し、 create_dataset_from_llama_documentsを入力します。 Enterを押して、オペレーターのモーダルを開きます。このオペレーターは、マルチモーダルデータ（画像、テキストファイル、PDFなど）を含むディレクトリを選択し、そこからFiftoneデータセットを作成するUIを提供します。

ディレクトリを選択したら、オペレーターを実行します。 Fiftoneセッションで新しいデータセットが作成されます。テキストファイルの場合、切り捨てられたテキストの画像レンダリングが表示されます。画像の場合、画像自体が表示されます。

add_llama_documents_to_datasetオペレーターを使用して、マルチモーダルデータのディレクトリを追加できます。

マルチモーダルデータセットのインデックス付け

マルチモーダルデータセットができたので、LlamainDexとMilvusでインデックスを作成できます。 create_multimodal_rag_indexオペレーターを使用して、このプロセスを入力します。このオペレーターは、インデックスに名前を付けるように求められ、クリップエンミングまたはキャプションを介して画像をインデックス化するオプションを提供します。キャプションを選択すると、キャプションとして使用するテキストフィールドを選択するように求められます。

データセットにキャプションがない場合は、Fiftone Image Captioningプラグインに興味があるかもしれません。

fiftyone plugins download https://github.com/jacobmarks/fiftyone-image-captioning-plugin

インデックスを検査します

インデックスを作成したら、 get_multimodal_rag_index_infoオペレーターを実行し、ドロップダウンから検査するインデックスを選択して、それを検査できます。

インデックスのクエリ

最後に、 query_multimodal_rag_indexオペレーターでインデックスを照会できます。この演算子は、クエリ文字列とクエリのインデックスを入力するように求めます。

また、検索された結果を生成するために使用するマルチモーダルモデル、および取得する画像結果とテキスト結果の両方を指定することもできます。

サポートされているマルチモーダルモデル

GPT-4V
Google Gemini Pro Vision
COG-VLM
fuyu-8b
llava-13b
Minigpt-4

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-05-26
サイズ 12.51KB
から Github

fiftyone multimodal rag plugin

フィフティオン、llamaindex、およびmilvusを備えたマルチモーダルラグ

導入

インストール

使用法

設定

マルチモーダルデータセットの作成

マルチモーダルデータセットのインデックス付け

インデックスを検査します

インデックスのクエリ

サポートされているマルチモーダルモデル

scite zotero plugin

BaseElements Plugin

index cli plugin

Cats Blender Plugin Unofficial

napari plugin manager

スーパーイメージプラグイン

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express