gpt 2 tensorflow2.0 Téléchargement - gpt 2 tensorflow2.0 Téléchargement du code source

gpt 2 tensorflow2.0

Autre code source

1.0.0

Télécharger

GPT-2 pré-formation et génération de texte, implémentée dans TensorFlow 2.0

Implémenté à l'origine dans TensorFlow 1.14 par Oapenai: - "Openai / GPT-2". Document Openai GPT-2: - "Les modèles de langue sont des apprenants multitâches non surveillés"

** Ce référentiel a une implémentation de pré-formation et de génération de séquence Openai GPT-2 dans TensorFlow 2.0, **

Exigences

Python> = 3,6
setuptools == 41.0.1
ftfy == 5.6
tqdm == 4.32.1
Click == 7.0
phrase == 0,1,83
Tensorflow-gpu == 2.3.0
Numpy == 1.16.4

Installation

 $ git clone https://github.com/akanyaani/gpt-2-tensorflow2.0
$ cd gpt-2-tensorflow2.0
$ pip install -r requirements.txt

Vous pouvez pré-entraîner le modèle à l'aide d'échantillons de données disponibles dans le référentiel ou vous pouvez télécharger les données à l'aide de ce repo github https://github.com/eukaryote31/openwebtext

Modèle de pré-formation sur les exemples de données disponibles dans le référentiel

 $ python pre_process.py --help

Options:
  --data-dir TEXT        training data path  [default: /data/scraped]
  --vocab-size INTEGER   byte pair vocab size  [default: 24512]
  --min-seq-len INTEGER  minimum sequence length  [default: 15]
  --max-seq-len INTEGER  maximum sequence length  [default: 512]
  --help                 Show this message and exit.
  
  
>> python pre_process.py

Modèle de pré-formation sur OpenWebText ou toute autre donnée

 >> python pre_process.py --data-dir=data_directory --vocab-size=32000

 $ python train_gpt2.py --help

Options:
  --num-layers INTEGER      No. of decoder layers  [default: 8]
  --embedding-size INTEGER  Embedding size  [default: 768]
  --num-heads INTEGER       Number of heads  [default: 8]
  --dff INTEGER             Filter Size  [default: 3072]
  --max-seq-len INTEGER     Seq length  [default: 515]
  --vocab-size INTEGER      Vocab size  [default: 24512]
  --optimizer TEXT          optimizer type  [default: adam]
  --batch-size INTEGER      batch size  [default: 8]
  --learning-rate FLOAT     learning rate  [default: 0.001]
  --graph-mode BOOLEAN      TF run mode  [default: False]
  --distributed BOOLEAN     distributed training  [default: False]
  --help                    Show this message and exit.
  
  
>> python train_gpt2.py 
  --num-layers=8 
  --num-heads=8 
  --dff=3072 
  --embedding-size=768 
  --batch-size=32 
  --learning-rate=5e-5
  --graph-mode=True

Formation distribuée sur plusieurs GPU.

 >> python train_gpt2.py 
  --num-layers=8 
  --num-heads=8 
  --dff=3072 
  --embedding-size=768 
  --batch-size=32 
  --learning-rate=5e-5 
  --distributed=True 
  --graph-mode=True

Démarrez Tensorboard via la ligne de commande.

 $ tensorboard --logdir /log

Après avoir pré-toléré votre modèle, vous pouvez générer des séquences en donnant un peu de contexte au modèle. Ouvrez ce cahier et chargez le modèle pré-entraîné et passez le contexte pour le modèle, il renverra la séquence générée.

 $ sequence_generator.ipynb

FAIRE

 1. Parallel Preprocessing.
2. Shared weights across layers.
3. Factorized embedding.
4. Fine-Tuning wrapper.

Références:

"Openai / GPT-2"
"Huggingface Pytorch Transformateurs"
"Transformers TensorFlow"
"Le GPT-2 illustré"

Contribution

Vos problèmes et PRS sont toujours les bienvenus.

Auteur

Abhay Kumar
Courriel de l'auteur: [email protected]
Suivez-moi sur Twitter

Licence

Mit

Graphique de calcul du modèle GPT-2.

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-03-11
taille 1.79MB
Provenant de Github

Applications connexes

iHuzu CMS v1.0 Bêta12

2024-11-14
Horror Ice Cream Version 82.0 Menu piraté

2024-06-21
La dernière version du cinéma et de la télévision GPT

2023-10-30
WordPress v5.0 bêta3

2022-07-05
JinBlog v2.0

2022-06-01
Plateforme de connexion unifiée Oauth2.0 v1.2

2022-05-28

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout