Descargar gpt 2 tensorflow2.0 - Descargar el código fuente gpt 2 tensorflow2.0

gpt 2 tensorflow2.0

Otro código fuente

1.0.0

Descargar

GPT-2 Precraining y generación de texto, implementada en Tensorflow 2.0

Originalmente implementado en TensorFlow 1.14 por Oapenai:- "OpenAI/GPT-2". Papel Operai GPT-2:-"Los modelos de idiomas son alumnos multitarea sin supervisión"

** Este repositorio tiene la implementación de generación de secuencia y de secuencia de OpenAI GPT-2 en TensorFlow 2.0, **

Requisitos

Python> = 3.6
setuptools == 41.0.1
ftfy == 5.6
tqdm == 4.32.1
Haga clic == 7.0
SentencePiece == 0.1.83
tensorflow-gpu == 2.3.0
Numpy == 1.16.4

Configuración

 $ git clone https://github.com/akanyaani/gpt-2-tensorflow2.0
$ cd gpt-2-tensorflow2.0
$ pip install -r requirements.txt

Puede pre-Entrenar el modelo utilizando datos de muestra disponibles en Repository o puede descargar los datos utilizando este repositorio de GitHub https://github.com/eukaryote31/openwebtext

Modelo de entrenamiento previo en los datos de muestra disponibles en el repositorio

 $ python pre_process.py --help

Options:
  --data-dir TEXT        training data path  [default: /data/scraped]
  --vocab-size INTEGER   byte pair vocab size  [default: 24512]
  --min-seq-len INTEGER  minimum sequence length  [default: 15]
  --max-seq-len INTEGER  maximum sequence length  [default: 512]
  --help                 Show this message and exit.
  
  
>> python pre_process.py

Modelo de pre-entrenamiento en OpenWebText o cualquier otro datos

 >> python pre_process.py --data-dir=data_directory --vocab-size=32000

 $ python train_gpt2.py --help

Options:
  --num-layers INTEGER      No. of decoder layers  [default: 8]
  --embedding-size INTEGER  Embedding size  [default: 768]
  --num-heads INTEGER       Number of heads  [default: 8]
  --dff INTEGER             Filter Size  [default: 3072]
  --max-seq-len INTEGER     Seq length  [default: 515]
  --vocab-size INTEGER      Vocab size  [default: 24512]
  --optimizer TEXT          optimizer type  [default: adam]
  --batch-size INTEGER      batch size  [default: 8]
  --learning-rate FLOAT     learning rate  [default: 0.001]
  --graph-mode BOOLEAN      TF run mode  [default: False]
  --distributed BOOLEAN     distributed training  [default: False]
  --help                    Show this message and exit.
  
  
>> python train_gpt2.py 
  --num-layers=8 
  --num-heads=8 
  --dff=3072 
  --embedding-size=768 
  --batch-size=32 
  --learning-rate=5e-5
  --graph-mode=True

Entrenamiento distribuido en múltiples GPU.

 >> python train_gpt2.py 
  --num-layers=8 
  --num-heads=8 
  --dff=3072 
  --embedding-size=768 
  --batch-size=32 
  --learning-rate=5e-5 
  --distributed=True 
  --graph-mode=True

Inicie TensorBoard a través de la línea de comando.

 $ tensorboard --logdir /log

Después de realizar previamente su modelo, puede generar secuencias dando algún contexto para modelar. Abra este cuaderno y cargue el modelo previado y pase el contexto para modelarlo, devolverá la secuencia generada.

 $ sequence_generator.ipynb

HACER

 1. Parallel Preprocessing.
2. Shared weights across layers.
3. Factorized embedding.
4. Fine-Tuning wrapper.

Referencias:

"OpenAi/GPT-2"
"Huggingface Pytorch-Transformers"
"TensorFlow Transformers"
"El GPT-2 ilustrado"

Contribución

Sus problemas y PR siempre son bienvenidos.

Autor

Abhay kumar
Correo electrónico del autor: [email protected]
Sígueme en Twitter

Licencia

MIT

Gráfico de cálculo del modelo GPT-2.

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-03-11
tamaño 1.79MB
Proviene de Github

Aplicaciones relacionadas

iHuzu CMS v1.0 Beta12

2024-11-14
Menú pirateado Horror Ice Cream versión 82.0

2024-06-21
La última versión de GPT cine y televisión.

2023-10-30
WordPress v5.0 beta3

2022-07-05
JinBlog v2.0

2022-06-01
Plataforma de inicio de sesión unificada Oauth2.0 v1.2

2022-05-28

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo