PWC RAG
1.0.0
コードを使用した論文のRAGは、ボタンを押すだけで大量のML研究をスキャンする簡単な方法です。大量の情報を簡単に採掘するRAGシステム。あなたはそれに自然言語であなたの質問をするので、それはコード付きの論文で見つけた関連する論文に従って答えます。
バックエンド側では、システムには、ハギングフェイスにBGEモデルを使用している埋め込みのために、アップスタッシュと呼ばれるスケーラブルなサーバーレスベクトルデータベースに依存する検索拡張生成(RAG)フレームワークで駆動されます。
フロントエンド側では、このアシスタントは、Streamlitで構築されたインタラクティブで簡単に展開可能なWebアプリケーションに統合されます。
レポをクローンします
git clone https://github.com/wittyicon29/PWC-RAG.gitワークスペースディレクトリに移動します
cd PWC-RAG Vector DBへのインデックスデータへのインデックス作成最初に、UpStashでインデックスを作成し、 .envファイルの資格情報を入力する必要があります。
UPSTASH_URL=...
UPSTASH_TOKEN=...
次のコマンドを実行します。
python -m src.index_papers --query " Mistral " --limit 200「ミストラル」クエリに一致する200のチャンクをインデックス化する結果。


Remollitアプリケーションをローカルで実行します
Streamlitアプリを実行する前に、 '.env'ファイルにHuggingface APIトークンを設定する必要があります。
HUGGINGFACE_API_TOKEN=...これで、Restrylitアプリができます
python -m streamlit run src/app.py
PaperSwithCodeとチャットするためにLLM駆動のアプリを構築する方法