tf transformers Download - tf transformers Quellcode Download

tf transformers

AI-Quellcode

1.0.0

Herunterladen

Tensorflow -Transformatoren

Website: https://legacyai.github.io/tf-transformers

TF-Transformatoren: schneller und einfacher auf dem neuesten Transformator in Tensorflow 2.0

Stellen Sie sich vor, die automatische Generation ist schneller 90x . TF-Transformatoren (Tensorflow-Transformatoren) sind so konzipiert, dass sie die volle Kraft von Tensorflow 2 nutzen und speziell für transformatorbasierte Architektur entwickelt wurden.

Diese Modelle können angewendet werden:

Text, für Aufgaben wie Textklassifizierung, Informationsextraktion, Fragenbeantwortung, Zusammenfassung, Übersetzung, Textgenerierung, in über 100 Sprachen.
? ️ Bilder für Aufgaben wie Bildklassifizierung, Objekterkennung und Segmentierung.
Audio für Aufgaben wie Spracherkennung und Audioklassifizierung. (Bald kommen)

Einzigartige Funktionen

Schneller autoreggressive Dekodierung
Tflite -Unterstützung
Das Erstellen von TFRECORDS ist einfach .
Automatische Tf.Data.Dataset oder TF.Gagged Tensors
Alles ist ein Wörterbuch (Eingänge und Ausgänge)
Mehrere Maskenmodi wie kausal , benutzerdefiniert , Präfix .
TensorFlow-Text-Tokenizer- Unterstützung
Unterstützt GPU, TPU, Multi-GPU-Trainer mit Wandb, mehrere Rückrufe, Auto Tensorboard

Benchmark auf GPT2 -Textgenerierung

GPT2 Textgenerierung mit max_length=64 , num_beams=3 .

 tf_transformers : 31 minutes
huggingface_tf  : 83 minutes
huggingface_pt  : 36 minutes
huggingface_jax : 35 minutes

Von 83 minutes bis 31 minutes ist eine erhebliche Beschleunigung. 92 % Beschleunigung. Im Durchschnitt ist die TF-Transformatoren 80-90 % beschleunigt als die Implementierung von Tensorflow - Implementierung und in den meisten Fällen vergleichbar oder schneller als Pytorch .

Weitere Benchmarks finden Sie in Benchmark

Installation

Mit Pip

Dieses Repository wird auf Python 3.7+ und TensorFlow 2.7 getestet.

Empfohlene Voraussetzungen

pip install sentencepiece
pip install tensorflow-text > = 2.7.3
pip install tqdm

Installieren Sie tensorflow >= 2.7.0 [CPU or GPU] gemäß Ihrer Maschine. Sie sollten TF-Transformatoren in einer virtuellen Umgebung installieren. Wenn Sie mit den virtuellen Python -Umgebungen nicht vertraut sind, lesen Sie die Benutzerhandbuch.

Erstellen Sie zunächst eine virtuelle Umgebung mit der Version von Python, die Sie verwenden und aktivieren.

Dann müssen Sie mindestens einen TensorFlow installieren. Weitere Informationen zur Installationsseite TensorFlow Installation, Installationsseiten zum spezifischen Installationsbefehl für Ihre Plattform. Wir empfehlen dringend, [TensorFlow-Text] (https://www.tensorflow.org/text) zu installieren.

Wenn eines dieser Backends installiert wurde, können TF-Transformatoren wie folgt mit PIP installiert werden:

pip install tf-transformers

Von Quelle

git clone https://github.com/legacyai/tf-transformers.git
pip install poetry
cd tf-transformers
poetry install

Schnelle Tour

TF-Transformatoren-API ist sehr einfach und minimalistisch.

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' )
> >> model . save_checkpoint ( "/tmp/gpt2_model/" ) # Save Model

Für die Text-Generation ist es sehr wichtig hinzuzufügen: OBJ: use_auto_regressive=True . Dies ist für alle Modelle erforderlich.

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' , use_auto_regressive = True )

Um das Speichern und Lastmodell zu serialisieren,

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' )
> >> model . save_transformers_serialized ( "/tmp/gpt2_serialized/" )

# To load a serialized models for inference in prodcution:

> >> import tensorflow as tf
> >> loaded = tf . saved_model . load ( "/tmp/gpt2_serialized/" )
> >> model  = loaded . signatures [ 'serving_default' ]

Modelleingänge und Ausgänge

In TF-Transformern folgten wir hauptsächlich Functional API von Keras. Alle Modelle in tf-transformers sind verbunden und haben immer folgende Funktionen.

Modelleingaben

Wenn tf.keras.Model oder tf_transformers.core.LegacyModel , verwenden: print(model.input) .

Wenn tf.keras.Layer oder tf_transformers.core.LegacyLayer , verwenden: print(model.model_inputs) .

Modellausgaben

Wenn tf.keras.Model oder tf_transformers.core.LegacyModel , verwenden: print(model.output) .

Wenn tf.keras.Layer oder tf_transformers.core.LegacyLayer , verwenden: print(model.model_outputs) .

Tutorials

Wir haben Tutorials über die Abdeckung von Voraussetzungen, Finetunen, Klassenfikation, QA, Ner so viel mehr behandelt.

Lesen und schreiben Sie TFRecords mit TFT
Textklassifizierung mit Albert
Dynamisches MLM (im laufenden Vorverarbeitung mit TF-Text) in TPU
Bildklassifizierung Vit Multi -GPU Spiegelte
Satzeinbettungszug von Grund auf neu von Grund auf mit Quoara auf Roberta + Zeroshot STS-B
Eingabeaufforderung Engineering mit Clip
Frage Beantwortung als Generation - Squad V1 mit GPT2
Code zur Codeübersetzung (codExklue - java bis c#) mit T5

Modellnutzung

Textgenerierung mit GPT2
Textgenerierung mit T5
Satztransformatoren

Tflite Tutorials

Albert Tflite
Bert Tflite
Roberta Tflite

Warum sollte ich TF-Transformatoren verwenden?

Verwenden Sie hochmoderne Modelle in der Produktion mit weniger als 10 Codezeilen.
- Hochleistungsmodelle, besser als alle offiziellen Tensorflow -basierten Modelle
- Sehr einfache Klassen für alle nachgelagerten Aufgaben
- Vollständige Tflite -Unterstützung für alle Aufgaben.
Machen Sie branchenbasierte Erfahrung für Studenten und Gemeinschaft mit klaren Tutorials in Avalierbar
Trainieren Sie ein Modell für GPU , Multi-GPU , TPU mit fantastischer tf.keras.Model.fit
- Trainieren Sie hochmoderne Modelle in wenigen Codezeilen.
- Alle Modelle sind vollständig serialisierbar.
Passen Sie Modelle oder Pipelines mit minimaler oder ohne Codeänderung an.

Forschung

Der Forschungsabschnitt verfügt über Codes für die Vorausbildung verschiedener Modelle von ** mlm, T5, Clip usw. **. Alle diese Skripte sind so konzipiert, dass sie die volle Kraft der Tensorflow-io-Pipeline nutzen und auf TPU V2 und TPU V3 getestet wurden. In diesen werden Fehler erwartet, aber es dient als Zweck für Praktiker, das zu starten oder zu ändern, was wir bereits getan haben.

Beiträge

Joint Albert (kleinste und beste transformatorische Modell aller Zeiten) auf Kleber .

Wir haben nur wenige Experimente durchgeführt, um die Leistung von Albert-Basismodellen zu quetschen (das Konzept ist für alle Modelle und in TF-Transformatoren anwendbar. Es ist nicht in die Box.)

Die Idee ist, den Verlust für die angegebene Aufgabe in jeder Ebene Ihres Modells zu minimieren und Vorhersagen in jeder Ebene zu überprüfen. Nach unseren Experimenten können wir das beste kleinere Modell (dank Albert ) erhalten, und ab Layer 4 besiegten wir das kleinere Modell im Klebstoff -Benchmark. In Schicht 6 erhielten wir einen Kleberwert von 81,0 , was 4 Punkte vor Distillbert mit Klebstoff Score von 77 und Mobiltt Libue -Score von 78 entspricht.

Das Albert -Modell verfügt über 14 Millionen Parameter und durch die Verwendung von Layer 6 konnten wir die Verbindungsverbindung um 50% beschleunigen.

Das Konzept gilt für alle Modelle und Aufgaben.

Codes + Lesen Sie mehr

Langer Blocksequenztransformator

Durch die Aufteilung der Eingangssequenz in die Aufmerksamkeit und den Zusammenführen mit FFN -Schicht haben wir gezeigt, dass kleinere Maschinen die Sequenzverarbeitung bis zu 4096 Token in einer einzelnen V100 -GPU -Maschine durchführen können. Das Modell hat Pegasus Base (128 million) in PubMed Summarisation übertroffen, obwohl sie 60 million Parameter beträgt.

Codes + Lesen Sie mehr

Unterstützte Modelle Architekturen

TF-Transformatoren liefern derzeit die folgenden Architekturen.

Albert (aus Google Research und dem Toyota Technological Institute in Chicago) wurde mit dem Papier Albert veröffentlicht: A Lite Bert für das selbstbewertete Lernen von Sprachdarstellungen, von Zhenzhong Lan, Mingda Chen, Sebastian Goodman, Kevin Gimpel, Piyush Sharma, Radu Soricut.
Bert (von Google) wurde mit dem Papier veröffentlicht Bert: Vorausbildung von tiefen bidirektionalen Transformatoren für das Sprachverständnis von Jacob Devlin, Ming-Wei Chang, Kenton Lee und Kristina Toutanova.
Bert für die Sequenzgenerierung (von Google), die mit dem Papier veröffentlicht wurde, das vorgeborene Checkpoints für Sequenzgenerierungsaufgaben von Sascha Rothe, Shashi Narayan, Aliaksei Severyn, nutzt.
Electra (von Google Research/Stanford University), die mit den Papierelektra: Vorausbildung von Textcodierern als Diskriminatoren und nicht als Generatoren von Kevin Clark, Minh-Thang Luong, Quoc V. Le, Christopher D. Manning, veröffentlicht wurde.
GPT-2 (von Openai), die mit den Papiersprachmodellen veröffentlicht wurden, sind von Alec Radford*, Jeffrey Wu*, Rewon Child, David Luan, Dario Amodei ** und Ilya Sutskever ** unbeaufsichtigt Multitask-Lernende.
MT5 (von Google AI) wurde mit dem Papier MT5 veröffentlicht: ein massiv mehrsprachiger Text-zu-Text-Transformator durch Linting Xue, Noah Constant, Adam Roberts, Mihir Kale, Rami al-Rfou, Aditya Siddhant, Aditya Barua, Colin Raffel.
Roberta (von Facebook), die zusammen mit der Zeitung veröffentlicht wurde, einen robust optimierten Bert -Vorbereitungsansatz von Yinhan Liu, Myle Ott, Naman Goyal, Jingfei du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer, Veselin Stoyanov.
T5 (von Google AI) veröffentlicht mit dem Papier, das die Grenzen des Transferlernens mit einem einheitlichen Text-zu-Text-Transformator von Colin Raffel, Noam SHAZEER, ADAM ROBERTS sowie KATHERINE LEE und SHARAN NARANG sowie Michael Minena und Yanqi Zhou und Wei und Peter J. Liu untersucht.
Vision Transformer (ViT) (from Google AI) released with the paper An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale by Alexey Dosovitskiy, Lucas Beyer, Alexander Kolesnikov, Dirk Weissenborn, Xiaohua Zhai, Thomas Unterthiner, Mostafa Dehghani, Matthias Minderer, Georg Heigold, Sylvain Gelly, Jakob Uszkoreit, Neil Houlsby. 10 Clip (von OpenAI) veröffentlicht mit dem Papier, das übertragbare visuelle Modelle von Natural Language von Alec Radford, Jong Wook Kim, Chris Hallacy, Aditya Ramesh, Gabriel Goh, Sandhini Agarwal, Girish Sastry, Amanda Aszell, Pamela Mishkin, Jack Clark, Gretchen Krute, Ilya Sutken, Ilya Sutken, Ilya Sutken, Ilya Sutskever, veröffentlicht.