VGLM скачать - скачать исходный код VGLM

VGLM

AI Исходный код

1.0.0

Скачать

Универсальная генеративная языковая модель

Это реализация статьи:

Изучение универсального генеративного языкового языка с помощью параметров-эффективного переноса обучения . Чжаоцзян Лин , Андреа Мадотто , Паскаль Фунг Результаты EMNLP 2020 [PDF]

Если вы используете какие -либо исходные коды или наборы данных, включенные в этот инструментарий в вашей работе, укажите следующую статью. Bibtex перечислен ниже:

 @Article {lin2020Exploring,
  title = {Изучение универсальной генеративной языковой модели с помощью параметра-эффективного переноса обучения},
  Автор = {Лин, Чжаоцзян и Мадотто, Андреа и Фунг, Паскале},
  Journal = {arxiv preprint arxiv: 2004.03829},
  Год = {2020}
}

Абстрактный

Прекрасная настройка предварительно обученных генеративных языковых моделей для задач генерации языка в нисходящем потоке показала многообещающие результаты. Тем не менее, это связано с стоимостью наличия единой, большой модели для каждой задачи, которая не идеальна в сценариях с низкой памяти/мощностью (например, мобильный). В этой работе мы предлагаем эффективный способ одновременно тонкой настройки нескольких задач генерации вниз по потоку с использованием одной большой предварительно обученной модели. Эксперименты в пяти разнообразных задачах генерации языка показывают, что, просто используя дополнительные 2-3% параметров для каждой задачи, наша модель может поддерживать или даже улучшить производительность точной настройки всей модели.

Универсальная генеративная языковая модель (VLM):

Модель универсального языка (VLM) состоит из трех компонентов: предварительно обученной языковой модели (например, GPT-2) и двух видов специализированных параметров для каждой задачи поколения, таких как остаточные адаптеры с низким рейтингом и встроенные задачи.

Зависимость

Проверьте необходимые пакеты или просто запустите команду

 ❱❱❱ pip install -r requirements.txt

Эксперименты

Набор данных

Загрузите предварительные наборы данных

Воспроизводимость

Мы предоставляем обученную контрольную точку нашего VLM.

Тестовая модель: выберите одну задачу из (MT, Summarization, Dialoge, QA, NLG].

 ❱❱❱ python ./evaluate_vlm.py --task mt --no_sample --model_checkpoint $model_path

Fine Tune GPT-2

Трансферный перевод машины:

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json

Тестовая машина перевод:

 ❱❱❱ python ./evaluate.py --task mt --no_sample --max_history=2 --model_checkpoint runs/$model_checkpoint

Проверьте run.sh для выполнения других задач

VLM адаптеры поездов и встроения задач

Трансферат по машине без знаний о перегородке

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json --adapter_bottleneck 300 --lr 0.0005

Перевод машины поезда с использованием дистилляции знаний на уровне предложений:

 ❱❱❱ python ./sentence_distiller.py --task mt --max_history=2 --model_checkpoint runs/$fully_finetuned_gpt2_checkpoint --no_sample

 ❱❱❱ python ./train.py --gradient_accumulation_steps=4 --max_history=2 --train_batch_size=8 --valid_batch_size=8 --n_epochs 8 --task mt --dataset_path data/NMT/data_en_ge.json --adapter_bottleneck 300 --lr 0.0005 --distillation

Тестовая машина Traslation:

 ❱❱❱ python ./evaluate.py --task mt --no_sample --adapter_bottleneck 300 --model_checkpoint runs/$model_checkpoint

Проверьте run.sh для выполнения других задач

Объедините все адаптеры и задачи, внедряющие в одну модель

Строка 68 Combine_all.py, чтобы предоставить список контрольных точек

 ❱❱❱ python combine_all.py

Тест, чтобы увидеть, такой же результат

 ❱❱❱ python ./evaluate_vlm.py --task mt --no_sample --model_checkpoint $model_path

Приведенные выше сценарии иллюстрируют, как непрерывно обучать VLM, когда задачи поступают последовательно.

Многозадачный обучение VLM

Когда все задачи доступны одновременно.

 ❱❱❱ python ./train_vlm.py --gradient_accumulation_steps=16 --train_batch_size=1 --valid_batch_size=1 --n_epochs 3

Подтверждение

Этот репозиторий реализован базой на Huggingface

Расширять

Дополнительная информация

Версия 1.0.0
Тип AI Исходный код
Время обновления 2025-09-08
размер 425.49KB
От Github

Связанные приложения

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

VGLM

Универсальная генеративная языковая модель

Абстрактный

Универсальная генеративная языковая модель (VLM):

Зависимость

Эксперименты

Подтверждение

ML stack

awesome free chatgpt

pywin_contextmenu

promptl

tick.chat

FastLoRAChat

chat.petals.dev

GPT Prompt Templates

GPTyped

ML stack

awesome free chatgpt

pywin_contextmenu

Google Dorks

shepherd

mongo express