記事リンク
このPythonプロジェクトは、MongoDBと2つの異なるLLMフレームワークを使用したセマンティック検索を示しています: LangchainとLlamaindex 。目標は、MongoDBからドキュメントをロードし、テキストデータの埋め込みを生成し、 LangchainとLlamaindexの両方のフレームワークを使用してセマンティック検索を実行することです。
このプロジェクトを実行するには、次の環境変数を.envファイルに設定する必要があります。
OPENAI_API_KEY = YOUR_OPENAI_API_KEY
MONGODB_URI = YOUR_MONGODB_CONNECTION_URI
MONGODB_COLL = YOUR_MONGODB_COLLECTION
MONGODB_VECTOR_INDEX = YOUR_MONGODB_VECTOR_INDEX
MONGODB_VECTOR_COLL_LANGCHAIN = YOUR_MONGODB_VECTOR_COLLECTION_LANGCHAIN
MONGODB_VECTOR_COLL_LLAMAINDEX = YOUR_MONGODB_VECTOR_COLLECTION_LLAMAINDEXプレースホルダーの値を実際のAPIキーと接続の詳細に置き換えてください。
依存関係をインストールします:
pip install -r requirements.txt
このプロジェクトは、指定されたMongoDBコレクション( MONGODB_COLL )からドキュメントをロードします。 MongoDBコレクションに、セマンティック検索を実行するテキストデータが含まれていることを確認してください。
このアプリケーションは、LangchainおよびLlamaindexフレームワークを使用して、ロードされたテキストデータの埋め込みを生成します。埋め込みは、別々のmongodbコレクション( MONGODB_VECTOR_COLL_LANGCHAINおよびMONGODB_VECTOR_COLL_LLAMAINDEX )に保存されます。
セマンティック検索は、LangchainとLlamaindexの両方のフレームワークを使用して実行されます。このプロセスには、埋め込みコレクションを照会し、プロンプトのセマンティックな類似性に基づいて関連文書を取得することが含まれます。
OPENAI_API_KEY 、外部言語モデル(OpenaiのGPTなど)を使用して生成を埋め込むために必要です。 MongoDB接続の詳細とコレクションを適切に構成してください。追加の構成または使用状況の詳細については、LangchainとLlamaindexの公式ドキュメントを確認してください。