DocSense
1.0.0

このプロジェクトは、さまざまなCOSINE類似性スキャンを使用してPDFドキュメントを比較するためのWebアプリケーションと、処理されたPDFと対話するチャットボットインターフェイスを提供します。アプリケーションは、Riremlit、Fastapi、およびLangchainを使用して構築されています。
リポジトリをクローンします:
git clone https://github.com/lakshya324/DocSense.git
cd DocSense必要なパッケージをインストールします。
pip install -r requirements.txt環境変数の設定:ルートディレクトリに.envファイルを作成し、環境変数を追加します。
GOOGLE_API_KEY=your-google-api-key
DEPLOYED=False
Llama 3とOllama:次のコマンドを実行して、Llama 3(8b)とOllamaをインストールします。
ollama run llama3retrylitアプリを実行します:
streamlit run app.pyホームページに移動します:
チャットボットページに移動します:
├── app.py # Main Streamlit application
├── compare.py # PDF comparison logic
├── pdf_extractor.py # PDF text extraction logic
├── text_preprocessing.py # Pre-processing of PDF text
├── LLM
│ ├── gemini.py # Google Gemini LLM integration
│ ├── llama3.py # LLAMA 3 LLM integration (OLLAMA)
│ ├── prompt.py # Prompt generation logic
├── embeddings
│ ├── CountVectorizer.py # Count Vectorization logic
│ ├── TfidfVectorizer.py # TF-IDF Vectorization logic
│ ├── all_MiniLM_L6_v2.py # All-MiniLM-L6-v2 Vectorization logic
├── result.py # Chatbot result processing
├── requirements.txt # Required Python packages
└── .env # Environment variables (not included in the repository)
このプロジェクトは、MITライセンスに基づいてライセンスされています。詳細については、ライセンスファイルを参照してください。