quickstart rag python
1.0.0
文章链接
这个Python项目使用MongoDB和两个不同的LLM框架展示了语义搜索: Langchain和Llamaindex 。目的是从MongoDB加载文档,生成文本数据的嵌入式文档,并使用Langchain和LlamainDex Frameworks进行语义搜索。
要运行此项目,您需要在.env文件中设置以下环境变量:
OPENAI_API_KEY = YOUR_OPENAI_API_KEY
MONGODB_URI = YOUR_MONGODB_CONNECTION_URI
MONGODB_COLL = YOUR_MONGODB_COLLECTION
MONGODB_VECTOR_INDEX = YOUR_MONGODB_VECTOR_INDEX
MONGODB_VECTOR_COLL_LANGCHAIN = YOUR_MONGODB_VECTOR_COLLECTION_LANGCHAIN
MONGODB_VECTOR_COLL_LLAMAINDEX = YOUR_MONGODB_VECTOR_COLLECTION_LLAMAINDEX确保用实际的API键和连接详细信息替换占位符值。
安装依赖项:
pip install -r requirements.txt
该项目从指定的MongoDB Collection( MONGODB_COLL )加载文档。确保您的MongoDB集合包含要执行语义搜索的文本数据。
该应用程序使用Langchain和Llamaindex框架生成了加载文本数据的嵌入式。嵌入式存储在单独的MongoDB集合中( MONGODB_VECTOR_COLL_LANGCHAIN和MONGODB_VECTOR_COLL_LLAMAINDEX )。
语义搜索是使用Langchain和Llamaindex框架进行的。该过程涉及根据提示的语义相似性查询嵌入式集合并检索相关文档。
使用外部语言模型(例如OpenAI的GPT)嵌入生成所需的OPENAI_API_KEY是必需的。确保适当地配置MongoDB连接详细信息和收集。检查官方文档中是否有Langchain和LlamainDex,以获取任何其他配置或使用详细信息。