DocSense
1.0.0

이 프로젝트는 처리 된 PDF와 상호 작용하기 위해 다른 코사인 유사성 스캔과 챗봇 인터페이스를 사용하여 PDF 문서를 비교하기위한 웹 응용 프로그램을 제공합니다. 응용 프로그램은 Streamlit, Fastapi 및 Langchain을 사용하여 구축됩니다.
저장소 복제 :
git clone https://github.com/lakshya324/DocSense.git
cd DocSense필요한 패키지 설치 :
pip install -r requirements.txt 환경 변수 설정 : 루트 디렉토리에서 .env 파일을 만들고 환경 변수를 추가하십시오.
GOOGLE_API_KEY=your-google-api-key
DEPLOYED=False
Llama 3과 Ollama : 다음 명령을 실행하여 Llama 3 (8b) 및 Ollama를 설치하십시오.
ollama run llama3간단한 앱 실행 :
streamlit run app.py홈페이지로 이동 :
챗봇 페이지로 이동하십시오 .
├── app.py # Main Streamlit application
├── compare.py # PDF comparison logic
├── pdf_extractor.py # PDF text extraction logic
├── text_preprocessing.py # Pre-processing of PDF text
├── LLM
│ ├── gemini.py # Google Gemini LLM integration
│ ├── llama3.py # LLAMA 3 LLM integration (OLLAMA)
│ ├── prompt.py # Prompt generation logic
├── embeddings
│ ├── CountVectorizer.py # Count Vectorization logic
│ ├── TfidfVectorizer.py # TF-IDF Vectorization logic
│ ├── all_MiniLM_L6_v2.py # All-MiniLM-L6-v2 Vectorization logic
├── result.py # Chatbot result processing
├── requirements.txt # Required Python packages
└── .env # Environment variables (not included in the repository)
이 프로젝트는 MIT 라이센스에 따라 라이센스가 부여됩니다. 자세한 내용은 라이센스 파일을 참조하십시오.