chatpdflike
1.0.0
使用大語言模型API的端到端文檔提問應用程序。
注意:此項目與CHATPDF隸屬或認可。這是一個獨立的項目,試圖複製類似的功能。
類似CHATPDF的Web應用程序是一個Web應用程序,允許用戶使用自然語言查詢上傳PDF文檔並與它們進行交互。該應用程序利用OpenAI的GPT-3.5 Turbo等大型語言模型(LLM)來了解PDF的內容,並為用戶問題提供簡潔明了的答案。
該應用程序遵循以下主要步驟:
文本提取和處理:
PyPDF2解析PDF。嵌入一代:
text-embedding-ada-002 )生成嵌入向量。用戶查詢處理:
相似性搜索:
及時施工:
答案生成:
響應顯示:
克隆存儲庫
git clone https://github.com/Ulov888/chatpdflike.git
cd chatpdflike安裝依賴項
使用pip安裝所需的軟件包:
pip install -r requirements.txt使用Openai的API:
在Openai註冊API鍵。
設置OPENAI_API_KEY環境變量:
export OPENAI_API_KEY= " your_openai_api_key "使用Ollama的API(如果需要):
從Ollama獲取API鍵。
設置OLLAMA_API_KEY環境變量:
export OLLAMA_API_KEY= " your_ollama_api_key " 啟動應用程序
運行燒瓶應用程序:
python run.py默認情況下,服務器在http://0.0.0.0:8080上運行。
訪問Web界面
打開Web瀏覽器並導航到http://localhost:8080 。
上傳PDF文檔
您可以:
與PDF互動
查看答案

可以通過修改generate_embedding.py中的提示策略,特別是在Chatbot機器人類的create_prompt方法中來定制語言模型的行為。
策略包括:
要選擇策略,您可以在調用create_prompt時修改strategy參數。
目前,該應用程序配置為為某些策略提供中文的答案。您可以修改提示以更改語言或調整模型的行為。
PyPDF2 ,可能無法完美處理所有PDF。具有異常格式的複雜PDF可能無法正確解析。歡迎捐款!如果您有任何建議或改進,請隨時提交問題或提取請求。
該項目是根據Apache許可證獲得許可的。