rag with knowledge base management
1.0.0
與語音助手和知識基礎管理系統集成的抹布(檢索型生成生成)應用程序。
該應用程序將抹布(檢索儀的生成)模型與語音助手集成在一起,從而使用戶可以通過語音或文本輸入與系統進行交互。此外,它包括知識庫管理系統,使用戶能夠通過URL添加,查看和刪除RAG模型使用的文檔。
該應用程序已在簡化共享中部署,可以通過以下URL訪問:
Langchain是一個框架,旨在構建利用語言模型的應用程序。它提供了將語言模型連接到外部數據源的工具,從而實現了更複雜和上下文的交互。
該應用程序使用多種OpenAI模型來提供對話能力和文檔檢索:
gpt-3.5-turbo ),以根據用戶查詢和以前的對話上下文生成響應。whisper-1 )自動語音識別以轉錄用戶的音頻輸入。此外,Cohere重新置換器(默認值: rerank-english-v2.0 ),以根據與查詢的相關性將其重新列為其相關性來提高檢索到的文檔的相關性。
Deeplake用作存儲和檢索文檔嵌入的矢量商店。它促進了從知識庫中的相關文檔的有效相似性搜索和檢索。
Apify是一個網絡刮擦和自動化平台,允許從網站提取數據。它用於刮下用戶提供的URL的文檔,並將其存儲在知識庫中。
簡化是一個開源應用程序框架,它允許以最少的精力為機器學習和數據科學項目創建自定義的Web應用程序。它在這裡用於構建應用程序的用戶界面。
要在本地安裝應用程序,您需要在計算機上安裝Docker。然後,運行以下命令:
docker build -t rag-with-knowledge-base-management .docker run -p 8501:8501 rag-with-knowledge-base-management現在,應在http:// localhost:8501上訪問該應用程序。
在運行應用程序之前,請確保將API鍵添加到.env文件中。 .env.example內部的以下鍵需要填充:
OPENAI_API_KEY OPENAI API密鑰COHERE_API_KEY cohere api鍵APIFY_API_TOKEN apify api api令牌ACTIVELOOP_TOKEN activeloop api令牌ACTIVELOOP_ORG_ID激活組織ID 根據開源APACHE 2.0許可分發。有關更多信息,請參見LICENSE 。
以下存儲庫在構建此項目中很有用: