Этот репозиторий обеспечивает основу для классификации на основе быстрого на основе быстрого использования с использованием предварительно обученных языковых моделей с акцентом на задачи классификации персидского текста. Он включает в себя сценарии и записные книжки для создания подсказок, подсказок с тонкой настройкой для классификации, оценки результатов и анализа показателей производительности модели, таких как оценка F1, точность и отзыв. Репозиторий также поддерживает обучение K-ST для повышения адаптивности модели путем включения соответствующих примеров.
Коды : содержит основной код и ноутбуки для обучения модели, генерации быстрого обращения и оценки.
AYA-Colab.ipynb : основная записная книжка для обучения и настройки подсказок с моделями AYA на Colab.Classification_report.ipynb : генерирует метрики классификации, включая оценку F1, точность и отзыв для различных настройки подсказки.Creating_dataset.ipynb : подготовка данных и создание наборов данных для обучения на основе быстрого обучения.f1-calculation.py : сценарий Python для расчета и визуализации баллов F1.news-aya-symbol-tuning.ipynb : ноутбук для настройки на основе символов с моделями AYA для классификации текста.news-aya-system-user-prompt.ipynb : Скрипт для генерации системных и пользовательских подсказок с использованием предварительно обученной языковой модели.Symbol_tuning_aya.ipynb : ноутбук для настройки символов для оптимизации оперативной эффективности.Наборы данных : содержит наборы данных, используемые для обучения и оценки.
Подсказки : содержит шаблоны приглашения, используемые для различных задач классификации.
Слайды : файлы документации и презентации, объясняющие встроенное обучение, быстрый дизайн, обучение K-STO и настройку символов.
In-Context Learning.pptx & In-Context Learning.pdf : Подробная информация об использовании встроенного обучения для настройки модели.System-User Prompt Design.pptx & System-User Prompt Design.pdf : Руководство по проектированию системы и пользовательских подсказок.Symbol Tuning.pptx & Symbol Tuning.pdf : Инструкции по использованию настройки символов для повышения оперативной производительности. Клонировать репозиторий:
git clone https://github.com/ShayanSalehi81/BachelorProject
cd BachelorProjectУстановите необходимые пакеты:
pip install -r requirements.txtАутентификация с обнимающим лицом (при необходимости) и установите дополнительные библиотеки:
huggingface-cli login --token YOUR_HUGGINGFACE_TOKEN Запустите любой из ноутбуков или сценариев Python в каталоге Codes , чтобы выполнить такие задачи, как создание набора данных, настройка или оценка.
Generator загружает предварительно обученную языковую модель, подсказывает форматы и генерирует прогнозы. Скрипт поддерживает 4-битное квантование для эффективного использования памяти и использует предоставленные пользователя подсказки для классификации данных персидских новостей как «важных» или «не важно».news-aya-symbol-tuning.ipynb и Symbol_tuning_aya.ipynb , предназначены для символов с тонкой настройкой, которые могут улучшить интерпретацию модели и согласованность ответа. Настройка символов вносит незначительные корректировки подсказок, улучшая понимание нюансированных запросов модели. Creating_dataset.ipynb для предварительной обработки и отформатировать ваш набор данных.news-aya-system-user-prompt.ipynb для определения системных и пользовательских подсказок и запуска классификации в наборе данных.Classification_report.ipynb для расчета метрик, таких как точность и оценка F1 и f1-calculation.py для визуализации производительности.news-aya-symbol-tuning.ipynb чтобы уточнить быстрый дизайн с помощью настройки символов. Этот проект лицензирован по лицензии MIT.
Взносы приветствуются! Не стесняйтесь отправлять проблемы, запросы на функции или обращать запросы для улучшения этого проекта.