lora vit finetuning Скачать - загрузка исходного кода lora vit finetuning

lora vit finetuning

AI Исходный код

1.0.0

Скачать

Лора тонкая настройка для классификационных задач

Этот репозиторий демонстрирует использование адаптации с низким уровнем ранга (LORA) для тонкой базовой модели Google для двух задач классификации: идентификация продуктов питания и идентификация действий человека . Каждое задание обучено и выводится отдельно с использованием LORA.

Базовая модель

В этой задаче мы использовали модель Google VIT google/vit-base-patch16-224-in21k
с параметрами около 86M . Ссылка на базовую модель обнимающего лица

Требования

Есть некоторые требования для запуска файлов. Python с версией> = 3,8 требуется.
Другие требования

transformers
datasets
evaluate
peft
torch и torchvision

Лора тонкая настройка

В целях тонкой настройки мы использовали эффективную настройку параметров peft на двух разных наборах данных

food101
Human-Action-Recognition См. Записную книжку Vit здесь

Вывод с Gradio

Чтобы запустить вывод, реализуется простое приложение Gradio. Мы можем выбрать любой модельный адаптер (еда / человек) и загрузить изображение, чтобы получить этикетку классификации.
app.py inference.py
Чтобы запустить вывод, запустите следующий код после загрузки или клонирования репозитория.