MultipDF Chat AIアプリに会いましょう! Langchainを使用して複数のPDFとシームレスにチャットし、Google Gemini Pro&Faiss Vector DBをシームレスな展開して展開します。 Awesome Google Gemini OpenSource Language Modelから即座に正確な応答を取得します。 PDFエクスペリエンスを今すぐ変換してください!
Multi-PDFのチャットエージェントは、チャットボットとのインタラクティブな会話を促進するために設計された、流線ベースのWebアプリケーションです。このアプリを使用すると、ユーザーは複数のPDFドキュメントをアップロードし、テキスト情報を抽出し、この抽出されたコンテンツを使用してチャットボットをトレーニングできます。ユーザーは、チャットボットとのリアルタイムな会話に従事することができます。
Riremlitでアプリを起動します


アプリケーションは、これらの手順に従って、質問への回答を提供します。
PDFの読み込み:アプリは複数のPDFドキュメントを読み取り、テキストコンテンツを抽出します。
テキストチャンキング:抽出されたテキストは、効果的に処理できる小さなチャンクに分割されます。
言語モデル:アプリケーションは言語モデルを使用して、テキストチャンクのベクトル表現(埋め込み)を生成します。
類似性マッチング:質問をすると、アプリはそれをテキストチャンクと比較し、最も意味的に類似したものを識別します。
応答生成:選択したチャンクは言語モデルに渡され、PDFSの関連コンテンツに基づいて応答を生成します。

アダプティブチャンキング:スライディングウィンドウチャンキングテクニックは、データの複雑さとコンテキストに基づいて、微粒と粗粒のデータアクセスのバランスをとる、ラグのウィンドウサイズと位置を動的に調整します。
マルチドキュメント会話QA :複数のドキュメントで同時にシンプルなマルチホップクエリとマルチホップクエリをサポートし、単一ドキュメントの制限を破ります。
ファイル互換性:PDFとTXTファイル形式の両方をサポートします。
LLMモデルの互換性:Google Gemini Pro、Openai GPT 3、Anthropic Claude、LLAMA2およびその他のオープンソースLLMSをサポートしています。

.envファイルから環境変数をロードするためのライブラリ。これは、コードの外側に構成設定、APIキー、その他の機密情報を保存するために一般的に使用されます。
リポジトリをクローンします:
git clone https://github.com/GURPREETKAURJETHRA/Multi-PDFs_ChatApp_AI-Agent.git
必要なPythonパッケージをインストールします。
pip install -r requirements.txt
https://makersuite.google.com/app/apikeyからGoogle APIキーをセットアップして、次の内容を持つプロジェクトのルートディレクトリに.ENVファイルを作成します。
GOOGLE_API_KEY =<your-api-key-here>
retrylitアプリを実行します:
streamlit run app.py
Multi-PDF-S ChatApp AIエージェントを使用するには、このリンクをクリックすることで、Restremlitでアプリを起動することで、外観を垣間見ることができます。アプリ、フォークアプリを実行し、以下の手順に従って使用を開始します。サイドバーを使用してPDFファイルをアップロードし、チャットボットをトレーニングします。トレーニングを受けたら、テキスト入力フィールドに質問を入力することで、チャットボットと会話することができます。
システムでプロジェクトを実行および実装する場合は、次の手順に従います。
.envファイルに追加したことを確認してください(必須)。app.pyファイルを実行します。次のコマンドを実行します。 streamlit run app.py
アプリケーションは、会話型AIを使用して、アップロードされたドキュメントのコンテンツに基づいて応答を提供します。応答はチャットインターフェイスに表示されます。
MITライセンスの下で配布されます。詳細については、 LICENSE参照してください。