tf transformers Download - tf transformers Código Fonte Download

tf transformers

Código-Fonte de IA

1.0.0

Baixar

Transformadores do Tensorflow

Site: https://legacyai.github.io/tf-transformers

TF-Transformers: Transformador de última geração mais rápido e fácil no Tensorflow 2.0

Imagine a geração automática regressiva para ser 90x mais rápida. O TF-Transformers (TensorFlow Transformers) foi projetado para aproveitar todo o poder do TensorFlow 2, projetado especificamente para a arquitetura baseada em transformadores.

Esses modelos podem ser aplicados em:

Texto, para tarefas como classificação de texto, extração de informações, resposta a perguntas, resumo, tradução, geração de texto, em mais de 100 idiomas.
? ️ Imagens, para tarefas como classificação de imagem, detecção de objetos e segmentação.
Áudio, para tarefas como reconhecimento de fala e classificação de áudio. (Em breve)

Recursos únicos

Decodificação autoreggressiva mais rápida
Suporte tflite
Criar TfRecords é simples .
Tf.data.dataSet ou tf.dataSet ou TF.
Tudo é dicionário (entradas e saídas)
Vários modos de máscara, como prefixo causal , definido pelo usuário .
Suporte do Tensorflow-Text Tokenizer
Suporta GPU, TPU, treinador multi-GPU com wandb, múltiplos retornos de chamada, tensorboard automático

Referência na geração de texto GPT2

Geração de texto GPT2 com max_length=64 , num_beams=3 .

 tf_transformers : 31 minutes
huggingface_tf  : 83 minutes
huggingface_pt  : 36 minutes
huggingface_jax : 35 minutes

De 83 minutes a 31 minutes é uma aceleração significativa. Speedup 92 % . Em média, o TF-Transformers é de 80 a 90 % de aceleração do que a implementação do HuggingFace Tensorflow e, na maioria dos casos, é comparável ou mais rápido que o Pytorch .

Mais benchmarks podem ser encontrados em benchmark

Instalação

Com pip

Este repositório é testado no Python 3.7+ e no Tensorflow 2.7.

Pré -requisitos recomendados

pip install sentencepiece
pip install tensorflow-text > = 2.7.3
pip install tqdm

Instale tensorflow >= 2.7.0 [CPU or GPU] conforme sua máquina. Você deve instalar o TF-Transformers em um ambiente virtual. Se você não estiver familiarizado com os ambientes virtuais do Python, consulte o guia do usuário.

Primeiro, crie um ambiente virtual com a versão do Python que você usará e o ativará.

Em seguida, você precisará instalar pelo menos um de Tensorflow. Consulte a página de instalação do TensorFlow, páginas de instalação sobre o comando de instalação específico da sua plataforma. É altamente recomendável instalar [TensorFlow-Text] (https://www.tensorflow.org/text).

Quando um desses backnds foi instalado, o TF-Transformadores pode ser instalado usando o PIP da seguinte forma:

pip install tf-transformers

Da fonte

git clone https://github.com/legacyai/tf-transformers.git
pip install poetry
cd tf-transformers
poetry install

Tour rápido

A API de TF-Transformers é muito simples e minimalista.

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' )
> >> model . save_checkpoint ( "/tmp/gpt2_model/" ) # Save Model

Para geração de texto, é muito importante adicionar: obj: use_auto_regressive=True . Isso é necessário para todos os modelos.

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' , use_auto_regressive = True )

Para serializar o modelo de salvamento e carga

 > >> from tf_transformers . models import GPT2Model
> >> model = GPT2Model . from_pretrained ( 'gpt2' )
> >> model . save_transformers_serialized ( "/tmp/gpt2_serialized/" )

# To load a serialized models for inference in prodcution:

> >> import tensorflow as tf
> >> loaded = tf . saved_model . load ( "/tmp/gpt2_serialized/" )
> >> model  = loaded . signatures [ 'serving_default' ]

Entradas e saídas de modelo

Nos transformadores de TF, seguimos principalmente Functional API de Keras. Todos os modelos nos tf-transformers estão conectados e sempre têm a seguinte funcionalidade.

Entradas de modelo

Se tf.keras.Model ou tf_transformers.core.LegacyModel , use: print(model.input) .

Se tf.keras.Layer ou tf_transformers.core.LegacyLayer , use: print(model.model_inputs) .

Saídas do modelo

Se tf.keras.Model ou tf_transformers.core.LegacyModel , use: print(model.output) .

Se tf.keras.Layer ou tf_transformers.core.LegacyLayer , use: print(model.model_outputs) .

Tutoriais

Cobrimos tutoriais cobrindo pré-treinamento, finetuning, classication, qa, ner mais.

Leia e escreva tfRecords usando TFT
Classificação de texto usando Albert
MLM dinâmico (em vez da mosca pré-processamento usando TF-Text) em TPU
Classificação da imagem Vit Multi -GPU espelhado
Frenda Incorporação de trem do zero usando Quoara em Roberta + Zeroshot STS-B
Engenharia rápida usando clipe
Perguntas Respondendo como Geração - Esquadrão V1 usando GPT2
Código para tradução de código (CodexGlue - Java para C#) usando T5

Uso do modelo

Geração de texto usando GPT2
Geração de texto usando T5
Transformadores de frases

Tutoriais do Tflite

Albert Tflite
Bert tflite
Roberta Tflite

Por que devo usar o TF-Transformers?

Use modelos de última geração na produção, com menos de 10 linhas de código.
- Modelos de alto desempenho, melhores do que todos os modelos oficiais baseados em tensorflow
- Aulas muito simples para todas as tarefas a jusante
- Preencha o suporte ao Tflite para todas as tarefas.
Faça experiência baseada no setor para avaliar para estudantes e comunidade com tutoriais claros
Treine qualquer modelo em GPU , Multi-GPU , TPU com incrível tf.keras.Model.fit
- Treine modelos de ponta em poucas linhas de código.
- Todos os modelos são completamente serializáveis.
Personalize quaisquer modelos ou pipelines com alteração mínima ou nenhuma de código.

Pesquisar

A seção de pesquisa possui códigos para pré-treinamento diferentes modelos que variam de ** mlm, t5, clipe etc **. Todos esses scripts foram projetados para aproveitar o poder total do pipeline TensorFlow-Io e testados em TPU V2 e TPU V3. Os bugs são esperados neles, mas serve como um objetivo para os praticantes iniciarem ou modificarem o que já fizemos.

Contribuições

Albert conjunto (modelo menor e melhor baseado em transformadores de todos os tempos) na cola .

Realizamos poucos experimentos para espremer o poder dos modelos de base de Albert (o conceito é aplicável a quaisquer modelos e transformadores de TF, ele está fora da caixa.)

A ideia é minimizar a perda para a tarefa especificada em cada camada do seu modelo e verifique as previsões em cada camada. De acordo com nossos experimentos, somos capazes de obter o melhor modelo menor (graças a Albert ) e, a partir da camada 4 , vencemos todo o modelo menor no benchmark de cola . Na camada 6 , obtivemos uma pontuação de cola de 81,0 , que está 4 pontos à frente de Distillbert com pontuação de cola de 77 e uma pontuação de cola de 78 Mobilebert .

O modelo Albert possui 14 milhões de parâmetros e, usando a camada 6 , conseguimos acelerar a computação em 50%.

O conceito é aplicável a todos os modelos e tarefas.

Códigos + Leia mais

Transformador de sequência de blocos longos

Ao dividir a sequência de entrada na atenção e a mesclagem do bloco usando a camada FFN, mostramos que, as máquinas menores poderão executar o processamento de sequência de até 4096 tokens em uma única máquina GPU V100. O modelo supera Pegasus Base (128 million) no PubMed Summarisation, apesar de ter 60 million parâmetros.

Códigos + Leia mais

Arquiteturas de modelos suportados

Atualmente, a TF-Transformers fornece as seguintes arquiteturas.

Albert (do Google Research e do Toyota Technological Institute em Chicago) lançado com o jornal Albert: A Lite Bert para o aprendizado auto-supervisionado de representações de idiomas, por Zhenzhong Lan, Mingda Chen, Sebastian Goodman, Kevin Gimpel, Piyush Sharma, Radu Soricut.
Bert (do Google) lançado com o artigo Bert: pré-treinamento de transformadores bidirecionais profundos para o entendimento de idiomas de Jacob Devlin, Ming-Wei Chang, Kenton Lee e Kristina Toutanova.
Bert para geração de seqüências (do Google) lançado com os pontos de verificação pré-treinados em papel que alavancam as tarefas de geração de sequência de Sascha Rothe, Shashi Narayan, Aliaksei Severyn.
Electra (do Google Research/Stanford University) lançado com o papel Electra: codificadores de texto pré-treinamento como discriminadores, em vez de geradores de Kevin Clark, Minh-Thang Luong, Quoc V. Le, Christopher D. Manning.
O GPT-2 (do OpenAI) liberado com os modelos de idiomas de papel são aprendizes multitarefa sem supervisão por Alec Radford*, Jeffrey Wu*, Rewon Child, David Luan, Dario Amodei ** e Ilya Sutskever **.
MT5 (do Google AI) lançado com o artigo MT5: um transformador de texto em texto pré-treinado multilíngue massivamente multilíngue, linhando Xue, Noah Constant, Adam Roberts, Mihir Kale, Rami al-Rfou, Aditya Siddhant, Aditya Barua, Colin Raffel.
Roberta (do Facebook), lançado em conjunto com o artigo, uma abordagem de pré -treinamento de Bert robustamente otimizada por Yinhan Liu, Myle Ott, Naman Goyal, Jingfei DU, Mandar Joshi, Danqi Chen, Omer Levy, Mike Lewis, Luke Zettlemoyer, Veselin Stoyanov.
T5 (do Google AI) lançado com o artigo explorando os limites do aprendizado de transferência com um transformador de texto em texto unificado por Colin Raffel e Noam Orheador e Adam Roberts e Katherine Lee e Sharan Narang e Michael Matena e Yanqi Zhou e Wei Li e Peter J. Liu.
Vision Transformer (ViT) (from Google AI) released with the paper An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale by Alexey Dosovitskiy, Lucas Beyer, Alexander Kolesnikov, Dirk Weissenborn, Xiaohua Zhai, Thomas Unterthiner, Mostafa Dehghani, Matthias Minderer, Georg Heigold, Sylvain Gelly, Jakob Uszkoreit, Neil Houlsby. 10 CLIP (from OpenAI) released with the paper Learning Transferable Visual Models From Natural Language Supervision by Alec Radford, Jong Wook Kim, Chris Hallacy, Aditya Ramesh, Gabriel Goh, Sandhini Agarwal, Girish Sastry, Amanda Askell, Pamela Mishkin, Jack Clark, Gretchen Krueger, Ilya Sutskever.