Этот проект направлен на то, чтобы точно настроить языковую модель Flan-T5, используя библиотеку Transformers Hugging Face. Следуя этим шагам, вы можете точно настроить модель и использовать ее для вывода.
Прежде чем начать работу, убедитесь, что у вас есть следующее:
Клонировать этот репозиторий на местную машину.
git clone https://github.com/mltrev23/Fine-Tuning-LLaMA-2/Установите необходимые пакеты, используя следующую команду:
pip install -r requirements.txtДоступно четыре метода точной настройки:
Аддитивная точная настройка : добавляет слои для тренировки.
python additive-fine-tuning.pyПолная тонкая настройка : тренируется все веса модели.
python full-fine-tuning.pyСелективная тонкая настройка : выбирает конкретные слои оригинальной модели для обучения.
python selective-fine-tuning.pyШаблон тонкая настройка : использует предопределенный шаблон для обучения. Шаблон может быть изменен по мере необходимости.
Чтобы пригласить свои собственные данные для точной настройки, измените код в своих сценариях для загрузки вашего набора данных. Вот пример загрузки текстового набора данных:
from transformers import LineByLineTextDataset
dataset = LineByLineTextDataset ( tokenizer = tokenizer , file_path = 'datasets/bittensor.txt' , block_size = 128 )Чтобы сделать вывод, используя тонкую модель Flan-T5, вы можете использовать следующие сценарии:
Создание использования прямого прохода : этот скрипт демонстрирует генерирование текста с использованием подхода прямого прохода.
python generate-using-forward.pyОсновной сценарий вывода : этот скрипт обеспечивает простой способ генерации выходов из модели.
python main.py Вы можете изменить входной текст в файле main.py , чтобы проверить модель:
input_text = [ "What is FAANG?" ]Это будет генерировать выход на основе предоставленного входа.
Не стесняйтесь модифицировать сценарии по мере необходимости для ваших конкретных задач и наборов данных. Если вы сталкиваетесь с какими -либо проблемами, проверьте документацию об объятиях или обратитесь за помощью к сообществу.
Не стесняйтесь корректировать любые разделы дальше в зависимости от ваших конкретных потребностей!