gpt 2 tensorflow2.0 Download - gpt 2 tensorflow2.0 Download do código fonte

gpt 2 tensorflow2.0

Outro código-fonte

1.0.0

Baixar

GPT-2 pré-treinamento e geração de texto, implementado no Tensorflow 2.0

Originalmente implementado no Tensorflow 1.14 por Oapenai:- "OpenAI/GPT-2". Artigo OpenAI GPT-2:-"Os modelos de idiomas são aprendizes multitarefa não supervisionados"

** Este repositório possui a implementação do OpenAI GPT-2 pré-treinamento e geração de sequência no Tensorflow 2.0, **

Requisitos

python> = 3.6
setupTools == 41.0.1
ftfy == 5.6
tqdm == 4.32.1
Clique == 7.0
peça de sentença == 0.1.83
tensorflow-gpu == 2.3.0
Numpy == 1.16.4

Configurar

 $ git clone https://github.com/akanyaani/gpt-2-tensorflow2.0
$ cd gpt-2-tensorflow2.0
$ pip install -r requirements.txt

Você pode pré-treinar o modelo usando dados de amostra disponíveis no repositório ou pode baixar os dados usando este github repo https://github.com/eucaryote31/openwebtext

Modelo de pré-treinamento em dados de amostra disponíveis no repositório

 $ python pre_process.py --help

Options:
  --data-dir TEXT        training data path  [default: /data/scraped]
  --vocab-size INTEGER   byte pair vocab size  [default: 24512]
  --min-seq-len INTEGER  minimum sequence length  [default: 15]
  --max-seq-len INTEGER  maximum sequence length  [default: 512]
  --help                 Show this message and exit.
  
  
>> python pre_process.py

Modelo de pré-treinamento no OpenWebtext ou qualquer outro dado

 >> python pre_process.py --data-dir=data_directory --vocab-size=32000

 $ python train_gpt2.py --help

Options:
  --num-layers INTEGER      No. of decoder layers  [default: 8]
  --embedding-size INTEGER  Embedding size  [default: 768]
  --num-heads INTEGER       Number of heads  [default: 8]
  --dff INTEGER             Filter Size  [default: 3072]
  --max-seq-len INTEGER     Seq length  [default: 515]
  --vocab-size INTEGER      Vocab size  [default: 24512]
  --optimizer TEXT          optimizer type  [default: adam]
  --batch-size INTEGER      batch size  [default: 8]
  --learning-rate FLOAT     learning rate  [default: 0.001]
  --graph-mode BOOLEAN      TF run mode  [default: False]
  --distributed BOOLEAN     distributed training  [default: False]
  --help                    Show this message and exit.
  
  
>> python train_gpt2.py 
  --num-layers=8 
  --num-heads=8 
  --dff=3072 
  --embedding-size=768 
  --batch-size=32 
  --learning-rate=5e-5
  --graph-mode=True

Treinamento distribuído em múltiplas GPU.

 >> python train_gpt2.py 
  --num-layers=8 
  --num-heads=8 
  --dff=3072 
  --embedding-size=768 
  --batch-size=32 
  --learning-rate=5e-5 
  --distributed=True 
  --graph-mode=True

Inicie o Tensorboard através da linha de comando.

 $ tensorboard --logdir /log

Depois de pré -treinar seu modelo, você pode gerar sequências, dando algum contexto para modelar. Abra este notebook e carregue o modelo pré -traido e passe o contexto para modelar ele retornará a sequência gerada.

 $ sequence_generator.ipynb

PENDÊNCIA

 1. Parallel Preprocessing.
2. Shared weights across layers.
3. Factorized embedding.
4. Fine-Tuning wrapper.

Referências:

"Openai/GPT-2"
"Huggingface pytorch-transformadores"
"Transformadores de tensorflow"
"O GPT-2 ilustrado"

Contribuição

Seus problemas e PRs são sempre bem -vindos.

Autor

Abhay Kumar
Email do autor: [email protected]
Siga -me no Twitter

Licença

Mit

Gráfico de computação do modelo GPT-2.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-03-11
tamanho 1.79MB
Vindo de Github

Aplicativos Relacionados

iHuzu CMS v1.0 Beta12

2024-11-14
Menu hackeado do Horror Ice Cream versão 82.0

2024-06-21
A versão mais recente do filme e televisão GPT

2023-10-30
WordPress v5.0 beta3

2022-07-05
JinBlog v2.0

2022-06-01
Plataforma de login unificado Oauth2.0 v1.2

2022-05-28

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos