DocSense
1.0.0

該項目提供了一個Web應用程序,用於使用不同的餘弦相似性掃描和聊天機器人接口比較PDF文檔,以與處理的PDF進行交互。該應用程序是使用Sparlit,fastapi和Langchain構建的。
克隆存儲庫:
git clone https://github.com/lakshya324/DocSense.git
cd DocSense安裝所需的軟件包:
pip install -r requirements.txt設置環境變量:在根目錄中創建一個.env文件,並添加您的環境變量:
GOOGLE_API_KEY=your-google-api-key
DEPLOYED=False
設置Llama 3和Ollama :通過運行以下命令:安裝Llama 3(8b)和Ollama:
ollama run llama3運行簡化應用程序:
streamlit run app.py導航到主頁:
導航到聊天機器人頁面:
├── app.py # Main Streamlit application
├── compare.py # PDF comparison logic
├── pdf_extractor.py # PDF text extraction logic
├── text_preprocessing.py # Pre-processing of PDF text
├── LLM
│ ├── gemini.py # Google Gemini LLM integration
│ ├── llama3.py # LLAMA 3 LLM integration (OLLAMA)
│ ├── prompt.py # Prompt generation logic
├── embeddings
│ ├── CountVectorizer.py # Count Vectorization logic
│ ├── TfidfVectorizer.py # TF-IDF Vectorization logic
│ ├── all_MiniLM_L6_v2.py # All-MiniLM-L6-v2 Vectorization logic
├── result.py # Chatbot result processing
├── requirements.txt # Required Python packages
└── .env # Environment variables (not included in the repository)
該項目是根據MIT許可證獲得許可的 - 有關詳細信息,請參見許可證文件。