tf transformers Скачать - скачать исходный код tf transformers

tf transformers

AI Исходный код

1.0.0

Скачать

Tensorflow Transformers

Веб-сайт: https://legacyai.github.io/tf-transformers

TF-трансформаторы: быстрее и более простой современный трансформатор в Tensorflow 2.0

Представьте, что авто-регрессивное поколение будет в 90 раз быстрее. TF-трансформаторы (Tensorflow Transformers) предназначены для использования всей мощности Tensorflow 2, разработанной специально для архитектуры на основе трансформаторов.

Эти модели могут быть применены:

Текст, для таких задач, как классификация текста, извлечение информации, ответ на вопросы, суммирование, перевод, генерация текста, на более чем 100 языках.
? ️ изображения, для таких задач, как классификация изображений, обнаружение объекта и сегментация.
Аудио, для таких задач, как распознавание речи и классификация звука. (Вскоре)

Уникальные функции

Более быстрое авторегрессивное декодирование
Tflite поддержка
Создать tfrecords просто .
Автоцикла tf.data.dataset или tf.ragged tensors
Все есть словарь (входы и выходы)
Многочисленные режимы маски, такие как причинный , определяемый пользователем префикс .
Поддержка токенизатора TensorFlow-Text
Поддерживает GPU, TPU, тренер с несколькими GPU с Wandb, несколькими обратными вызовами, автоматическим Tensorboard

Эталон по генерации текста GPT2

Генерация текста GPT2 с max_length=64 , num_beams=3 .

 tf_transformers : 31 minutes
huggingface_tf  : 83 minutes
huggingface_pt  : 36 minutes
huggingface_jax : 35 minutes

От 83 minutes до 31 minutes является значительным ускорением. 92 % ускорение. В среднем, TF-трансформаторы составляют ускорение на 80-90 % , чем реализация Tensorflow HuggingFace, и в большинстве случаев она сопоставима или быстрее, чем Pytorch .

Больше тестов можно найти в тесте

Установка

С Pip

Этот репозиторий проверяется на Python 3.7+ и Tensorflow 2.7.

Из источника

git clone https://github.com/legacyai/tf-transformers.git
pip install poetry
cd tf-transformers
poetry install

Быстрый тур

TF-трансформаторы API очень прост и минималистично.

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' )
> >> model . save_checkpoint ( "/tmp/gpt2_model/" ) # Save Model

Для генерации текста очень важно добавить: obj: use_auto_regressive=True . Это требуется для всех моделей.

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' , use_auto_regressive = True )

Для сериализации модели сохранения и загрузки

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' )
> >> model . save_transformers_serialized ( "/tmp/gpt2_serialized/" )

# To load a serialized models for inference in prodcution:

> >> import tensorflow as tf
> >> loaded = tf . saved_model . load ( "/tmp/gpt2_serialized/" )
> >> model  = loaded . signatures [ 'serving_default' ]

Входные данные и выходы модели

В TF-трансформаторах мы в основном следили за Functional API из кера. Все модели в tf-transformers подключены и всегда имеют следующую функциональность.

Модель входов

Если tf.keras.Model или tf_transformers.core.LegacyModel , используйте: print(model.input) .

Если tf.keras.Layer или tf_transformers.core.LegacyLayer , используйте: print(model.model_inputs) .

Модели выходов

Если tf.keras.Model или tf_transformers.core.LegacyModel , используйте: print(model.output) .

Если tf.keras.Layer или tf_transformers.core.LegacyLayer , используйте: print(model.model_outputs) .

Учебные пособия

Мы рассмотрели учебные пособия, охватывающие предварительную тренировку, создание, классу, QA, NER намного больше.

Читайте и пишите TFRECORDS с использованием TFT
Текстовая классификация с использованием Альберта
Динамический MLM (на предварительной обработке FLY с использованием TF-текста) в TPU
Классификация изображений Vit Multi GPU зеркально
Предложение встраиваю поезд с нуля с использованием Quoara на Roberta + Zeroshot STS-B
Быстрое инженерное проектирование с помощью клипа
Ответ на вопрос как поколение - команда V1 с использованием GPT2
Код в код перевод (CodexGlue - Java to C#) с использованием T5

Модель использования

Генерация текста с использованием gpt2
Генерация текста с использованием T5
Предложения трансформаторы

TFLITE TURANTIONS

Альберт Тфлите
БЕРТ ТФЛИТ
Роберта Тфлите

Почему я должен использовать TF-трансформаторы?

Используйте современные модели в производстве, с менее чем 10 строк кода.
- Высокоэффективные модели, лучше, чем все официальные модели на основе TensorFlow
- Очень простые занятия для всех вниз по течению задач
- Полная поддержка Tflite для всех задач.
Сделайте отраслевой опыт для обстоятельств для студентов и сообщества с четкими учебниками
Тренируйте любую модель на графическом процессоре , мульти-GPU , TPU с удивительным tf.keras.Model.fit
- Обучайте современные модели в нескольких строках кода.
- Все модели полностью сериализуются.
Настройте любые модели или трубопроводы с минимальным или без изменения кода.

Исследовать

В разделе исследования есть коды для предварительного обучения различных моделей, начиная от ** MLM, T5, клипа и т. Д. **. Все эти сценарии предназначены для использования полной мощности трубопровода Tensorflow-IO и протестированы на TPU V2 и TPU V3. Ожидается ошибки в них, но это служит целью для практических факторов начать или изменять то, что мы уже сделали.

Вклад

Совместный Альберт (наименьшая и лучшая модель на основе трансформаторов) на клей .

Мы провели несколько экспериментов, чтобы сжать мощность базовых моделей Альберта (концепция применима к любым моделям и в TF-трансформаторах, она находится вне коробки.)

Идея заключается в минимизации потери для указанной задачи в каждом уровне вашей модели и проверяйте прогнозы на каждом уровне. Согласно нашим экспериментам, мы можем получить лучшую меньшую модель (благодаря Альберту ), и с уровня 4 мы победили всю меньшую модель в Clue Clarkmark. По слону 6 мы получили балл клея 81,0 , что на 4 балла опережает Дистилберт с баллом клея 77 и баллом Mobilebert 78 .

Модель Альберта имеет 14 миллионов параметров, и, используя слой 6 , мы смогли ускорить сравнение на 50%.

Концепция применима ко всем моделям и задачам.

Коды + Подробнее

Трансформатор с длинной блокой

Разделив входную последовательность на блокировку и слияние с использованием слоя FFN, мы показали, что небольшие машины смогут выполнять обработку последовательностей до 4096 токенов на одном машине GPU V100. Модель опережает Pegasus Base (128 million) в Summarization PubMed несмотря на то, что она составляет 60 million параметров.

Коды + Подробнее

Поддерживаемые модели архитектуры

TF-трансформаторы в настоящее время предоставляют следующие архитектуры.

Альберт (из Google Research и Toyota Technological Institute в Чикаго), выпущенный с статьей Albert: A Lite Bert для самоотверженного изучения языковых представлений, Чжэнчжонг Лан, Мингда Чен, Себастьян Гудман, Кевин Гимптель, Пиюш Шарма, Раду Сорекут.
Берт (из Google) выпущен с бумагой Bert: предварительное обучение глубоких двунаправленных трансформаторов для понимания языка Джейкоба Девлина, Мин-Вей Чанга, Кентона Ли и Кристины Тутанова.
Bert для генерации последовательностей (из Google), выпущенная с бумагой, использующей предварительно обученные контрольные точки для задач генерации последовательностей Саша Роте, Шаши Нараян, Алиаксеей Северин.
Electra (из Google Research/Stanford University), выпущенная с Paper Electra: Traving Text Encoders в виде дискриминаторов, а не генераторов Кевина Кларка, Мин-Танга Луонга, Кука В. Ле, Кристофера Д. Мэннинга.
GPT-2 (от Openai), выпущенные с моделями бумаги, являются неконтролируемыми многозадажными учениками от Alec Radford*, Jeffrey Wu*, Rewon Child, David Luan, Dario Amodei ** и Ilya Sutskever **.
MT5 (от Google AI), выпущенный с бумагой MT5: массово многоязычный предварительно обученный трансформатор текста в тексте, Linting Xue, Noah Constant, Adam Roberts, Mihir Kale, Rami Al-Rfou, Aditya Siddhant, Aditya Barua, Colin Raffel.
Роберта (из Facebook), выпущенная вместе с газетой, надежно оптимизированный подход Bert, предварительно предварительного подготовки Иньхана Лю, Майла Отта, Намана Гояла, Цзингфей Дю, Мандара Джоши, Данки Чена, Омера Леви, Майк Льюис, Люк Зеттлемера, Веселина Стоянови.
T5 (из Google AI) выпущен с документом, исследующими пределы трансферного обучения с помощью единого трансформатора текста в текст Колина Раффела и Ноама Шазира, Адама Робертса и Кэтрин Ли и Шарана Наранга и Майкла Матена и Янки Чжоу и Вэй Ли и Питера Дж. Лю.
Vision Transformer (Vit) (из Google AI), выпущенный с статьей. USZKOREIT, Нил Хоулсби. 10 Клип (от Openai), выпущенный с переносимыми визуальными моделями, обучающимися на бумаге, от надзора с естественным языком Алеком Рэдфордом, Чон Вуком Ким, Крисом Холласи, Адитьей Рамеш, Габриэлем Го, Сандхини Агарвалом, Гириш Сыпри, Амандой Аскетл, Памелой Мишкин, Джеком Кларком, Гретхен Кругером, Илью Сайскевером.