Descargar tf transformers - Descargar el código fuente tf transformers

tf transformers

Código Fuente de IA

1.0.0

Descargar

Transformadores de flujo tensor

Sitio web: https://legacyai.github.io/tf Transformers

TF-Transformers: Transformador de última generación más rápido y más fácil en Tensorflow 2.0

Imagine que la generación automática es 90x más rápida. TF-Transformers (TensorFlow Transformers) está diseñado para aprovechar toda la potencia de TensorFlow 2, diseñada específicamente para la arquitectura basada en transformadores.

Estos modelos se pueden aplicar en:

Texto, para tareas como clasificación de texto, extracción de información, respuesta a preguntas, resumen, traducción, generación de texto, en más de 100 idiomas.
? ️ Imágenes, para tareas como la clasificación de imágenes, la detección de objetos y la segmentación.
Audio, para tareas como el reconocimiento de voz y la clasificación de audio. (Muy pronto)

Características únicas

Decodificación autororregesa más rápida
Soporte tflite
Crear tfrecords es simple .
TF.Data.Dataset o TF.Rragged Tensors
Todo es diccionario (entradas y salidas)
Modos de máscara múltiples como el prefijo causal , definido por el usuario .
soporte de tokenizador de texto tensorflow
Admite GPU, TPU, entrenador de múltiples GPU con WandB, múltiples devoluciones de llamada, Auto Tensorboard

Benchmark en GPT2 Generación de texto

GPT2 Generación de texto con max_length=64 , num_beams=3 .

 tf_transformers : 31 minutes
huggingface_tf  : 83 minutes
huggingface_pt  : 36 minutes
huggingface_jax : 35 minutes

De 83 minutes a 31 minutes es una aceleración significativa. 92 % de aceleración. En promedio, TF-Transformers es 80-90 % de velocidad que la implementación de Huggingface TensorFlow y, en la mayoría de los casos, es comparable o más rápido que Pytorch .

Se pueden encontrar más puntos de referencia en Benchmark

Instalación

Con Pip

Este repositorio se prueba en Python 3.7+ y TensorFlow 2.7.

Prerrequistas recomendados

pip install sentencepiece
pip install tensorflow-text > = 2.7.3
pip install tqdm

Instale tensorflow >= 2.7.0 [CPU or GPU] según su máquina. Debe instalar TF-Transformers en un entorno virtual. Si no está familiarizado con los entornos virtuales de Python, consulte la guía del usuario.

Primero, cree un entorno virtual con la versión de Python que va a usar y lo active.

Luego, deberá instalar al menos uno de TensorFlow. Consulte la página de instalación de TensorFlow, páginas de instalación con respecto al comando de instalación específico para su plataforma. Recomendamos encarecidamente instalar [tensorflow-text] (https://www.tensorflow.org/text).

Cuando se ha instalado uno de esos backends, los transformadores TF se pueden instalar utilizando PIP de la siguiente manera:

pip install tf-transformers

De la fuente

git clone https://github.com/legacyai/tf-transformers.git
pip install poetry
cd tf-transformers
poetry install

Recorrido rápido

La API de TF-Transformers es muy simple y minimalista.

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' )
> >> model . save_checkpoint ( "/tmp/gpt2_model/" ) # Save Model

Para la generación de texto, es muy importante agregar: OBJ: use_auto_regressive=True . Esto es necesario para todos los modelos.

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' , use_auto_regressive = True )

Para serializar el modelo de guardado y carga

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' )
> >> model . save_transformers_serialized ( "/tmp/gpt2_serialized/" )

# To load a serialized models for inference in prodcution:

> >> import tensorflow as tf
> >> loaded = tf . saved_model . load ( "/tmp/gpt2_serialized/" )
> >> model  = loaded . signatures [ 'serving_default' ]

Entradas y salidas del modelo

En los transformadores de TF, seguimos principalmente Functional API de Keras. Todos los modelos en tf-transformers están conectados y siempre tienen la siguiente funcionalidad.

Entradas de modelo

Si tf.keras.Model o tf_transformers.core.LegacyModel , use: print(model.input) .

Si tf.keras.Layer o tf_transformers.core.LegacyLayer , use: print(model.model_inputs) .

Salidas de modelo

Si tf.keras.Model o tf_transformers.core.LegacyModel , use: print(model.output) .

Si tf.keras.Layer o tf_transformers.core.LegacyLayer , use: print(model.model_outputs) .

Tutoriales

Hemos cubierto tutoriales que cubren la capacitación previa, la delicadeza, la clasificación, el control de calidad, mucho más.

Leer y escribir TFRecords usando TFT
Clasificación de texto usando Albert
MLM dinámico (en el preprocesamiento de moscas usando TF-Text) en TPU
Clasificación de imagen Vit Multi GPU reflejado
Frase que incrusta el tren desde cero usando quoara en Roberta + Zeroshot STS-B
Ingeniería rápida usando clip
Respuesta de preguntas como generación - Escuadrón V1 usando GPT2
Translación de código a código (CodExGlue - Java a C#) usando T5

Uso de modelo

Generación de texto usando GPT2
Generación de texto usando T5
Transformadores de oración

Tutoriales tflite

Albert tflite
Bert tflite
Roberta tflite

¿Por qué debería usar TF-Transformers?

Use modelos de vanguardia en la producción, con menos de 10 líneas de código.
- Modelos de alto rendimiento, mejor que todos los modelos oficiales basados en TensorFlow
- Clases muy simples para todas las tareas aguas abajo
- Complete el soporte TFLITE para todas las tareas.
Haga una experiencia basada en la industria a la avaliable para los estudiantes y la comunidad con tutoriales claros
Entrena cualquier modelo en GPU , Multi-GPU , TPU con increíble tf.keras.Model.fit
- Entrene modelos de vanguardia en pocas líneas de código.
- Todos los modelos son completamente serializables.
Personaliza cualquier modelo o tuberías con un cambio de código mínimo o sin ningún cambio.

Investigación

La sección de investigación tiene códigos para la capacitación de diferentes modelos que van desde ** MLM, T5, Clip, etc. **. Todos estos scripts están diseñados para aprovechar plena potencia de la tubería TensorFlow-II y probadas en TPU V2 y TPU V3. Se esperan errores en esos, pero sirve como un propósito para que los practicantes comiencen o modifiquen lo que ya hemos hecho.

Contribuciones

Junta Albert (modelo más pequeño y mejor basado en transformadores) sobre el pegamento .

Hemos realizado pocos experimentos para exprimir el poder de los modelos base de Albert (el concepto es aplicable a cualquier modelos y en transformadores de TF, está fuera de la caja).

La idea es minimizar la pérdida para la tarea especificada en cada capa de su modelo y verificar las predicciones en cada capa. Según nuestros experimentos, podemos obtener el mejor modelo más pequeño (gracias a Albert ), y desde la capa 4 en adelante vencimos a todo el modelo más pequeño en el punto de referencia de pegamento . Por la capa 6 , obtuvimos un puntaje de pegamento de 81.0 , que está 4 puntos por delante de Distillbert con puntaje de pegamento de 77 y puntaje de Glue Mobilbert de 78 .

El modelo Albert tiene 14 millones de parámetros, y al usar la capa 6 , pudimos acelerar la componación en un 50%.

El concepto es aplicable a todos los modelos y tareas.

Códigos + Leer más

Transformador de secuencia de bloque largo

Al dividir la secuencia de entrada en la atención y fusionar la capa de FFN, hemos demostrado que las máquinas más pequeñas podrán realizar un procesamiento de secuencia de hasta 4096 tokens en una sola máquina GPU V100. El modelo ha superado Pegasus Base (128 million) en el resumen PubMed a pesar de ser de 60 million de parámetros.

Códigos + Leer más

Arquitecturas de modelos compatibles

TF-Transformers actualmente proporciona las siguientes arquitecturas.

Albert (de Google Research y el Toyota Technological Institute en Chicago) lanzado con el documento Albert: A Lite Bert para el aprendizaje auto-supervisado de las representaciones lingüísticas, por Zhenzhong Lan, Mingda Chen, Sebastian Goodman, Kevin Gimpel, Piyush Sharma, Radu Soricut.
Bert (de Google) lanzado con el documento Bert: pre-entrenamiento de transformadores bidireccionales profundos para la comprensión del lenguaje por Jacob Devlin, Ming-Wei Chang, Kenton Lee y Kristina Toutanova.
Bert para la generación de secuencias (de Google) lanzado con el papel que aprovecha los puntos de control previamente capacitados para las tareas de generación de secuencias de Sascha Rothe, Shashi Narayan, Aliaksei Severyn.
Electra (de Google Research/Stanford University) lanzó con el documento Electra: codificadores de texto previos al entrenamiento como discriminadores en lugar de generadores de Kevin Clark, Minh-Thang Luong, Quoc V. LE, Christopher D. Manning.
GPT-2 (de OpenAI) lanzado con los modelos de lenguaje de papel son alumnos de múltiples tareas sin supervisión de Alec Radford*, Jeffrey Wu*, Rewon Child, David Luan, Dario Amodei ** e Ilya Sutskever **.
MT5 (de Google AI) lanzado con el documento MT5: un transformador de texto a texto previamente multilingüe masivamente multilingüe por Linting Xue, Noah Constant, Adam Roberts, Mihir Kale, Rami al-Rfou, Aditya Siddhant, Aditya Barua, Colin Raffel.
Roberta (de Facebook), lanzado junto con el periódico un enfoque de pre -proyenamiento de Bert con sólida optimización de Yinhan Liu, Myle Ott, Naman Goyal, Jingfei du, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer, Veselin Stoyanov.
T5 (de Google AI) lanzado con el artículo que explora los límites del aprendizaje de transferencia con un transformador unificado de texto a texto de Colin Raffel y Noam Shazeer y Adam Roberts y Katherine Lee y Sharan Narang y Michael Matena y Yanqi Zhou y Wei Li y Peter J. Liu.
Vision Transformer (ViT) (from Google AI) released with the paper An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale by Alexey Dosovitskiy, Lucas Beyer, Alexander Kolesnikov, Dirk Weissenborn, Xiaohua Zhai, Thomas Unterthiner, Mostafa Dehghani, Matthias Minderer, Georg Heigold, Sylvain Gelly, Jakob Uszkoreit, Neil Houlsby. 10 clip (de OpenAi) lanzado con el papel aprendiendo modelos visuales transferibles de la supervisión del lenguaje natural por Alec Radford, Jong Wook Kim, Chris Hallacy, Aditya Ramesh, Gabriel Goh, Sandhini Agarwal, Girish Sastry, Amanda Askell, Pamela Mishkin, Jack Clark, Gretchen Krueger, Ilya Sutskever.