tf transformers Télécharger - tf transformers Code source Télécharger

tf transformers

Code Source AI

1.0.0

Télécharger

Transformers TensorFlow

Site Web: https://legacyai.github.io/tf-transformateurs

TF-transformateurs: transformateur à la pointe de la technologie plus rapide et plus facile dans TensorFlow 2.0

Imaginez que la génération auto-régressive soit 90x plus vite. Les transformateurs TF (transformateurs TensorFlow) sont conçus pour exploiter la pleine puissance de TensorFlow 2, conçu spécifiquement pour l'architecture basée sur le transformateur.

Ces modèles peuvent être appliqués:

Texte, pour des tâches telles que la classification du texte, l'extraction d'informations, la réponse aux questions, le résumé, la traduction, la génération de texte, dans plus de 100 langues.
Les images, pour des tâches comme la classification des images, la détection d'objets et la segmentation.
Audio, pour des tâches comme la reconnaissance vocale et la classification audio. (À venir)

Caractéristiques uniques

Décodage autorégressif plus rapide
Support Tflite
La création de tfrecords est simple .
Tf.Data.Dataset ou TF.Data.Data.Data
Tout est dictionnaire (entrées et sorties)
Plusieurs modes de masque comme le préfixe causal , défini par l'utilisateur .
Prise en charge du tokenizer TensorFlow-Text
Prend en charge GPU, TPU, entraîneur multi-GPU avec WANDB, rappels multiples, Tensorboard automatique

Benchmark sur la génération de texte GPT2

Génération de texte GPT2 avec max_length=64 , num_beams=3 .

 tf_transformers : 31 minutes
huggingface_tf  : 83 minutes
huggingface_pt  : 36 minutes
huggingface_jax : 35 minutes

De 83 minutes à 31 minutes est une accélération importante. Papée 92 % . En moyenne, les transformateurs TF sont de 80 à 90% d'amélioration que la mise en œuvre de TensorFlow en étreignant et dans la plupart des cas, il est comparable ou plus rapide que Pytorch .

Plus de repères peuvent être trouvés dans Benchmark

Installation

Avec pip

Ce référentiel est testé sur Python 3.7+ et TensorFlow 2.7.

Conditions préalables recommandées

pip install sentencepiece
pip install tensorflow-text > = 2.7.3
pip install tqdm

Installez tensorflow >= 2.7.0 [CPU or GPU] selon votre machine. Vous devez installer des transformateurs TF dans un environnement virtuel. Si vous n'êtes pas familier avec les environnements virtuels Python, consultez le guide de l'utilisateur.

Tout d'abord, créez un environnement virtuel avec la version de Python que vous allez utiliser et activez-la.

Ensuite, vous devrez installer au moins un de TensorFlow. Veuillez vous référer à la page d'installation de TensorFlow, des pages d'installation concernant la commande d'installation spécifique de votre plate-forme. Nous vous recommandons fortement d'installer [Tensorflow-Text] (https://www.tensorflow.org/text).

Lorsque l'un de ces backends a été installé, les transformateurs TF peuvent être installés à l'aide de PIP comme suit:

pip install tf-transformers

De la source

git clone https://github.com/legacyai/tf-transformers.git
pip install poetry
cd tf-transformers
poetry install

Tournée rapide

L'API TF-transformateurs est très simple et minimaliste.

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' )
> >> model . save_checkpoint ( "/tmp/gpt2_model/" ) # Save Model

Pour la génération de texte, il est très important d'ajouter: obj: use_auto_regressive=True . Ceci est requis pour tous les modèles.

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' , use_auto_regressive = True )

Pour sérialiser le modèle de sauvegarde et de chargement

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' )
> >> model . save_transformers_serialized ( "/tmp/gpt2_serialized/" )

# To load a serialized models for inference in prodcution:

> >> import tensorflow as tf
> >> loaded = tf . saved_model . load ( "/tmp/gpt2_serialized/" )
> >> model  = loaded . signatures [ 'serving_default' ]

Modèle d'entrées et de sorties

Dans les transformateurs TF, nous avons surtout suivi Functional API de Keras. Tous les modèles dans tf-transformers sont connectés et ont toujours des fonctionnalités suivantes.

Entrées de modèle

Si tf.keras.Model ou tf_transformers.core.LegacyModel , utilisation: print(model.input) .

Si tf.keras.Layer ou tf_transformers.core.LegacyLayer , utilisez: print(model.model_inputs) .

Sorties du modèle

Si tf.keras.Model ou tf_transformers.core.LegacyModel , utilisation: print(model.output) .

Si tf.keras.Layer ou tf_transformers.core.LegacyLayer , utilisez: print(model.model_outputs) .

Tutoriels

Nous avons couvert des tutoriels couvrant la pré-formation, les finetuning, la classe, QA, NER beaucoup plus.

Lire et écrire des tfrecords en utilisant TFT
Classification de texte à l'aide d'Albert
Dynamic MLM (à la volée prétraitement à l'aide de TF-Text) dans TPU
Classification d'image Vit Multi GPU Miroration
Phrase intégrant le train à partir de zéro à l'aide de quoara sur Roberta + Zeroshot Sts-B
Ingénierie rapide à l'aide du clip
Question Répondre comme génération - Squad V1 Utilisation de GPT2
Traduction de code à code (CodexGlue - Java à C #) en utilisant T5

Utilisation du modèle

Génération de texte à l'aide de GPT2
Génération de texte en utilisant T5
Transformers de phrase

Tutoriels TFLITE

Albert Tflite
Bert tflite
Roberta tflite

Pourquoi devrais-je utiliser des transformateurs TF?

Utilisez des modèles de pointe en production, avec moins de 10 lignes de code.
- Modèles haute performance, mieux que tous les modèles officiels basés sur TensorFlow
- Cours très simples pour toutes les tâches en aval
- Terminez la prise en charge TFLITE pour toutes les tâches.
Faire de l'expérience basée sur l'industrie à AVALIABLE aux étudiants et à la communauté avec des tutoriels clairs
Train tout modèle sur GPU , multi-GPU , TPU avec incroyable tf.keras.Model.fit
- Train des modèles de pointe dans quelques lignes de code.
- Tous les modèles sont complètement sérialisables.
Personnalisez tous les modèles ou pipelines avec un changement de code minimal ou sans code.

Recherche

La section de recherche a des codes de pré-formation différents modèles allant de ** mlm, t5, clip, etc. Tous ces scripts sont conçus pour exploiter la pleine puissance du pipeline TensorFlow-IO et testés sur TPU V2 et TPU V3. Des bugs sont attendus dans ceux-ci, mais il sert à un objectif pour les praticiens de commencer ou de modifier ce que nous avons déjà fait.

Contributions

ALBERT conjoint (modèle basé sur le transformateur le plus petit et le meilleur de tous les temps) sur la colle .

Nous avons mené quelques expériences pour presser la puissance des modèles de base Albert (le concept est applicable à tous les modèles et dans les transformateurs TF, il est hors de la boîte.)

L'idée est de minimiser la perte de tâche spécifiée dans chaque couche de votre modèle et de vérifier les prédictions à chaque couche. Selon nos expériences, nous sommes en mesure d'obtenir le meilleur modèle plus petit (grâce à Albert ), et à partir de la couche 4 , nous avons battu tout le modèle plus petit dans Benchmark . Selon la couche 6 , nous avons obtenu un score de colle de 81,0 , soit 4 points d'avance sur Distillbert avec un score de colle de 77 et un score de colle de Mobilebert de 78 .

Le modèle Albert a 14 millions de paramètres, et en utilisant la couche 6 , nous avons pu accélérer la compuation de 50%.

Le concept est applicable à tous les modèles et tâches.

Codes + en savoir plus

Transformateur de séquence de blocs long

En divisant la séquence d'entrée en attention et en fusion en utilisant la couche FFN, nous avons montré que les machines plus petites pourront effectuer un traitement de séquence jusqu'à 4096 jetons dans une seule machine GPU V100. Le modèle a surpassé Pegasus Base (128 million) en résumé PubMed malgré un paramètre de 60 million .

Codes + en savoir plus

Architectures de modèles pris en charge

Les transformateurs TF fournissent actuellement les architectures suivantes.

Albert (de Google Research et le Toyota Technological Institute de Chicago) publié avec The Paper Albert: A Lite Bert for Auto-SuperVisé Apprentissage des représentations de la langue, par Zhenzhong Lan, Mingda Chen, Sebastian Goodman, Kevin Gimpel, Piyush Sharma, Radu Soricut.
Bert (de Google) publié avec le papier Bert: pré-formation de transformateurs bidirectionnels profonds pour la compréhension du langage par Jacob Devlin, Ming-Wei Chang, Kenton Lee et Kristina Toutanova.
Bert pour la génération de séquences (à partir de Google) publié avec le papier tirant parti des points de contrôle pré-formés pour les tâches de génération de séquences de Sascha Rothe, Shashi Narayan, Aliaksei Severyn.
Electra (de Google Research / Stanford University) Sorti avec le papier Electra: Pre-T-T-Text Text Encoders en tant que discriminateurs plutôt que générateurs de Kevin Clark, Minh-Thang Luong, Quoc V. LE, Christopher D. Manning.
Le GPT-2 (d'Openai) publié avec les modèles de langue papier est des apprenants multitâches non supervisés par Alec Radford *, Jeffrey Wu *, Rewon Child, David Luan, Dario Amodei ** et Ilya Sutskever **.
MT5 (de Google AI) publié avec le papier MT5: un transformateur de texte à texte pré-formé massivement multilingue en liant Xue, Noah Constant, Adam Roberts, Mihir Kale, Rami al-Rfou, Aditya Siddhant, Aditya Barua, Colin Raffel.
Roberta (de Facebook), libéré avec le journal, une approche de pré-formation de Bert optimisée de manière robuste de Yinhan Liu, Myle Ott, Naman Goyal, Jingfei Du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettloyer, Veselin Stoyanov.
T5 (de Google AI) publié avec le document explorant les limites de l'apprentissage par transfert avec un transformateur de texte à texte unifié par Colin Raffel et Noam Shazeer et Adam Roberts et Katherine Lee et Sharan Narang et Michael Matena et Yanqi Zhou et Wei Li et Peter J. Liu.
Vision Transformer (VIT) (de Google AI) publié avec l'article Une image vaut 16x16 mots: Transformers for Image Recognition à échelle par Alexey Dosovitskiy, Lucas Beyer, Alexander Kolesnikov, Dirk Weissenbor Uszkoreit, Neil Houlsby. 10 Clip (d'Openai) sorti avec l'apprentissage en papier Modèles visuels transférables de la supervision du langage naturel par Alec Radford, Jong Wook Kim, Chris Hallacy, Aditya Ramesh, Gabriel Goh, Sandhini Agarwal, Girish Sastry, Amanda Askell, Pamela Mishkin, Jack Clark, Gretchen Krueger, Ilya Sutskever.