Этот проект направлен на разработку высококвалифицированной юридической экспертной системы для контрактов с использованием поколения, связанного с поиском-август (RAG). Система использует передовые методы обработки естественного языка (NLP) для предоставления точных и контекстных ответов на вопросы о юридических контрактах и интегрирует мощную языковую модель с пользовательским механизмом поиска для предоставления точных и контекстных ответов на запросы, связанные с контрактами.
Legal_Expert_Contract_Advisor_Using_Precision_RAG/
├── data/
│ ├── raw/
│ ├── processed/
│ └── evaluation/
├── notebooks/
│ ├── 1_data_exploration.ipynb
│ ├── 2_rag_implementation.ipynb
│ └── 3_evaluation_and_optimization.ipynb
├── src/
│ ├── data/
│ │ ├── __init__.py
│ │ ├── preprocess.py
│ │ └── load_data.py
│ ├── models/
│ │ ├── __init__.py
│ │ ├── retriever.py
│ │ └── generator.py
│ ├── evaluation/
│ │ ├── __init__.py
│ │ └── metrics.py
│ └── utils/
│ ├── __init__.py
│ └── helpers.py
├── tests/
│ ├── test_data.py
│ ├── test_models.py
│ └── test_evaluation.py
├── config.yaml
├── requirements.txt
├── setup.py
├── main.py
├── .gitignore
└── README.md
data/ : содержит необработанные и обработанные файлы данныхnotebooks/ : jupyter Notebooks для исследования, реализации и оценкиsrc/ : исходный код для системы RAGdata/ : Сценарии загрузки данных и предварительная обработкаmodels/ : Реализации модели ретриверов и генератораevaluation/ : показатели оценки и сценарииutils/ : вспомогательные функции и утилитыtests/ : модульные тесты для различных компонентовconfig.yaml : файл конфигурации для настройки проектаrequirements.txt : Список зависимостей проектаsetup.py : сценарий настройки для проектаmain.py : основная точка входа для запуска тряпичной системы git clone https://github.com/dev-abuke/Legal_Expert_Contract_Advisor_Using_Precision_RAG.git cd Legal_Expert_Contract_Advisor_Using_Precision_RAGpython -m venv venv source venv/bin/activate # On Windows, use venvScriptsactivatepip install -r requirements.txt Подготовьте данные контракта и поместите их в data/raw/ Directory.
Предварительно обрабатывать данные
python src/data/preprocess.pypython main.pypython src/evaluation/evaluate.pynotebooks/ каталоге для разведки и прототипирования.src/ каталоге.tests/ каталог.config.yaml для управления параметрами проекта. Производительность системы оценивается с использованием следующих метрик
Обратитесь к записной книжке «Оценка» для подробных результатов и анализа.
Этот проект исследует различные методы оптимизации, включая
Взносы в улучшение системы приветствуются. Пожалуйста, следуйте этим шагам:
git checkout -b feature/your-feature )git commit -am 'Add new feature' )git push origin feature/your-feature )Этот проект лицензирован по лицензии MIT - для получения подробной информации см. Файл лицензии.
Для любых запросов, пожалуйста, откройте вопрос об этом хранилище или свяжитесь с Abubeker Shamil.