chatpdflike
1.0.0
使用大语言模型API的端到端文档提问应用程序。
注意:此项目与CHATPDF隶属或认可。这是一个独立的项目,试图复制类似的功能。
类似CHATPDF的Web应用程序是一个Web应用程序,允许用户使用自然语言查询上传PDF文档并与它们进行交互。该应用程序利用OpenAI的GPT-3.5 Turbo等大型语言模型(LLM)来了解PDF的内容,并为用户问题提供简洁明了的答案。
该应用程序遵循以下主要步骤:
文本提取和处理:
PyPDF2解析PDF。嵌入一代:
text-embedding-ada-002 )生成嵌入向量。用户查询处理:
相似性搜索:
及时施工:
答案生成:
响应显示:
克隆存储库
git clone https://github.com/Ulov888/chatpdflike.git
cd chatpdflike安装依赖项
使用pip安装所需的软件包:
pip install -r requirements.txt使用Openai的API:
在Openai注册API键。
设置OPENAI_API_KEY环境变量:
export OPENAI_API_KEY= " your_openai_api_key "使用Ollama的API(如果需要):
从Ollama获取API键。
设置OLLAMA_API_KEY环境变量:
export OLLAMA_API_KEY= " your_ollama_api_key " 启动应用程序
运行烧瓶应用程序:
python run.py默认情况下,服务器在http://0.0.0.0:8080上运行。
访问Web界面
打开Web浏览器并导航到http://localhost:8080 。
上传PDF文档
您可以:
与PDF互动
查看答案

可以通过修改generate_embedding.py中的提示策略,特别是在Chatbot机器人类的create_prompt方法中来定制语言模型的行为。
策略包括:
要选择策略,您可以在调用create_prompt时修改strategy参数。
目前,该应用程序配置为为某些策略提供中文的答案。您可以修改提示以更改语言或调整模型的行为。
PyPDF2 ,可能无法完美处理所有PDF。具有异常格式的复杂PDF可能无法正确解析。欢迎捐款!如果您有任何建议或改进,请随时提交问题或提取请求。
该项目是根据Apache许可证获得许可的。