PWC RAG
1.0.0
使用代碼的論文的抹布是通過單擊按鈕來掃描大量ML研究的一種更容易的方法。抹布系統,可輕鬆地挖掘大量信息。您將以自然語言詢問您的問題,它將根據與代碼的論文中找到的相關論文回答。
在後端,該系統採用檢索增強生成(RAG)框架供電,該框架依賴於一個名為UpStash的可擴展的無服務器矢量數據庫,對於嵌入式,我們在HuggingFace上使用BGE模型,而MixTral-8x7b-Instruct-v0.1作為LLM從HuggingFace中使用。
在前端,該助手將被集成到具有Spallit構建的交互式易於部署的Web應用程序中。
克隆倉庫
git clone https://github.com/wittyicon29/PWC-RAG.git移至工作區目錄
cd PWC-RAG索引將數據索引到矢量數據庫,您首先需要在船上創建一個索引,然後填寫.env文件中的憑據:
UPSTASH_URL=...
UPSTASH_TOKEN=...
運行以下命令:
python -m src.index_papers --query " Mistral " --limit 200索引200塊與“ Mistral”查詢相匹配的結果。


在本地運行簡化應用程序
在運行簡化應用程序之前,您必須在“ .env”文件中設置HuggingFace API令牌:
HUGGINGFACE_API_TOKEN=...現在您可以簡化應用程序
python -m streamlit run src/app.py
如何構建一個LLM驅動的應用程序與PaperswithCode聊天