rag with knowledge base management
1.0.0
与语音助手和知识基础管理系统集成的抹布(检索型生成生成)应用程序。
该应用程序将抹布(检索仪的生成)模型与语音助手集成在一起,从而使用户可以通过语音或文本输入与系统进行交互。此外,它包括知识库管理系统,使用户能够通过URL添加,查看和删除RAG模型使用的文档。
该应用程序已在简化共享中部署,可以通过以下URL访问:
Langchain是一个框架,旨在构建利用语言模型的应用程序。它提供了将语言模型连接到外部数据源的工具,从而实现了更复杂和上下文的交互。
该应用程序使用多种OpenAI模型来提供对话能力和文档检索:
gpt-3.5-turbo ),以根据用户查询和以前的对话上下文生成响应。whisper-1 )自动语音识别以转录用户的音频输入。此外,Cohere重新置换器(默认值: rerank-english-v2.0 ),以根据与查询的相关性将其重新列为其相关性来提高检索到的文档的相关性。
Deeplake用作存储和检索文档嵌入的矢量商店。它促进了从知识库中的相关文档的有效相似性搜索和检索。
Apify是一个网络刮擦和自动化平台,允许从网站提取数据。它用于刮下用户提供的URL的文档,并将其存储在知识库中。
简化是一个开源应用程序框架,它允许以最少的精力为机器学习和数据科学项目创建自定义的Web应用程序。它在这里用于构建应用程序的用户界面。
要在本地安装应用程序,您需要在计算机上安装Docker。然后,运行以下命令:
docker build -t rag-with-knowledge-base-management .docker run -p 8501:8501 rag-with-knowledge-base-management现在,应在http:// localhost:8501上访问该应用程序。
在运行应用程序之前,请确保将API键添加到.env文件中。 .env.example内部的以下键需要填充:
OPENAI_API_KEY OPENAI API密钥COHERE_API_KEY cohere api键APIFY_API_TOKEN apify api api令牌ACTIVELOOP_TOKEN activeloop api令牌ACTIVELOOP_ORG_ID激活组织ID 根据开源APACHE 2.0许可分发。有关更多信息,请参见LICENSE 。
以下存储库在构建此项目中很有用: