RAG-NIFICENT:由LLMS提供支持的AI聊天机器人用于引用自定义PDF,报告和指南
现在支持Meta AI的Llama-3.1

RAG-NIFICENT是一个最先进的存储库,利用检索功能的生成(RAG)的力量提供了来自PDF的策划的PDF目录的即时答案和参考,其中包含有关任何给定主题的信息,例如WHO建议文档。该系统旨在帮助研究人员,政策制定者和公众在广泛的文档中快速查找特定信息。
特征
- 对话界面:使用自然语言查询与系统互动,以接收直接从PDF采购的响应。
- 直接引用:系统中的每个响应都包含指向源PDF页面的直接链接,以确保可追溯性和验证。
- PDF目录:一组预定义的关键PDF文档,包括有关SOCISTOSOLIAS和MALARIA等主要健康主题的WHO建议。
可用型号
- ? Llama-3.1-8B燃烧:通过优化快速交互的此模型,可以进行即时,有效的响应。
- ? Llama-3.1-70B反之:利用此多功能模型以高准确性来实现多种复杂的语言任务。
- GPT-3.5-Turbo :与适合各种对话任务的高级,类似人类的相互作用进行互动。
- ? LLAMA3-70B-8192 :使用这种大型模型享受高端性能,非常适合深度学习见解。
- ? LLAMA3-8B-8192 :具有更易于使用的Llama3版本的强大功能,非常适合各种AI应用程序。
- ? Mixtral-8x7b-32768 :利用Mixtral的广泛能力来利用整体建模的力量,以进行细微的理解和响应产生。
- ? Gemma-7B-IT :与Gemma一起探索专门的互动和以技术为中心的解决方案,该解决方案是为其量身定制的和技术内容。
演示

它如何工作
该应用程序利用OpenAI嵌入,Pinecone矢量搜索和对话界面的组合来提供无缝的检索体验。进行查询时,系统:
- 将查询转换为嵌入。
- 使用Pinecone的矢量搜索搜索最相关的文档部分。
- 返回答案以及引用和链接到源文档。
设置
克隆存储库:
git clone https://github.com/yourusername/RAG-nificent.git
安装依赖项:
pip install -r requirements.txt
在.env中设置环境变量(另请参见.env.example文件:
-
PINECONE_INDEX_NAME -
PINECONE_NAME_SPACE -
OPENAI_API_KEY -
PINECONE_API_KEY -
GROQ_API_KEY
创建一个与PINECONE_INDEX_NAME相同名称的Pinecone索引。用dimensions=1536设置它,而metric=cosine 。
将PDFS放置在pdf_data目录中并运行data_ingestion.py
运行应用程序:
来源文档
该系统当前包括以下PDF的指南,并具有直接链接到文档:
- 世卫组织控制和消除人血吸虫病的指南(2022)
- 世卫组织疟疾指南(2023)