RAG Architecture
1.0.0
このプロジェクトは、マルチモーダルドキュメントを処理し、 Milvusデータベースを照会するための流線照明アプリケーションです。さまざまなファイルタイプから抽出されたテキストの処理、保存、クエリのために、 Langchain 、 Transformers 、 Easyocrなどの最先端のツールを活用します。
audio 、 video 、 image 、 text 、 csv 、 yaml 、 json 、 docx 、およびpdf複数のファイルタイプをサポートしています。speech_recognitionおよびpydub 。EasyOCR 。HuggingFaceEmbeddingsを利用します。pipまたはcondaパッケージマネージャーリポジトリのフォーク:rag-architecture githubリポジトリに移動し、 [フォーク]をクリックします。
フォークされたリポジトリをクローンします:
git clone https://github.com/ < your-username > /RAG-Architecture.git
cd RAG-Architecture
pip install -r requirements.txtretrylitアプリを実行します:
streamlit run app.py # # ? **File Structure**
` ` ` bash
project/
│
├── app.py # Main Streamlit application
├── requirements.txt # ? Python dependencies
├── utils/ # Utility modules
│ ├── audio_utils.py # ? Audio file processing
│ ├── video_utils.py # ? Video file processing
│ ├── image_utils.py # ?️ Image file processing
│ ├── document_loaders.py # Document processing loaders
│ ├── milvus_client.py # ?️ Initializes Milvus database
│
├── milvus_database.db # ?️ Milvus database file (auto-created)
├── Dataset # Folder to store datasets
├── Images # ? Folder for storing images
?キーモジュール
app.py?主なアプリケーションロジック
utils/ワークフローの例
example.pdf )。
?将来の改善
ライセンスこのプロジェクトは、 MITライセンスに基づいてライセンスされています。
?謝辞