gpt 2 tensorflow2.0下载gpt 2 tensorflow2.0源代码下载

gpt 2 tensorflow2.0

其他源码

1.0.0

下载

GPT-2预培训和文本生成，在Tensorflow 2.0中实现

最初由Oapenai在Tensorflow 1.14中实施： - “ OpenAI/GPT-2”。 OpenAI GPT-2纸： - “语言模型是无监督的多任务学习者”

**该存储库在Tensorflow 2.0中具有OpenAI GPT-2预训练和序列生成实现，**

要求

python> = 3.6
setuptools == 41.0.1
ftfy == 5.6
TQDM == 4.32.1
单击== 7.0
句子== 0.1.83
TensorFlow-GPU == 2.3.0
numpy == 1.16.4

设置

 $ git clone https://github.com/akanyaani/gpt-2-tensorflow2.0
$ cd gpt-2-tensorflow2.0
$ pip install -r requirements.txt

您可以使用存储库中可用的示例数据预先培训模型，也可以使用此Github repo https://github.com/eukaryote31/openwebtext下载数据

在存储库中可用的样本数据的预培训模型

 $ python pre_process.py --help

Options:
  --data-dir TEXT        training data path  [default: /data/scraped]
  --vocab-size INTEGER   byte pair vocab size  [default: 24512]
  --min-seq-len INTEGER  minimum sequence length  [default: 15]
  --max-seq-len INTEGER  maximum sequence length  [default: 512]
  --help                 Show this message and exit.
  
  
>> python pre_process.py

OpenWebText或任何其他数据的培训模型

 >> python pre_process.py --data-dir=data_directory --vocab-size=32000

 $ python train_gpt2.py --help

Options:
  --num-layers INTEGER      No. of decoder layers  [default: 8]
  --embedding-size INTEGER  Embedding size  [default: 768]
  --num-heads INTEGER       Number of heads  [default: 8]
  --dff INTEGER             Filter Size  [default: 3072]
  --max-seq-len INTEGER     Seq length  [default: 515]
  --vocab-size INTEGER      Vocab size  [default: 24512]
  --optimizer TEXT          optimizer type  [default: adam]
  --batch-size INTEGER      batch size  [default: 8]
  --learning-rate FLOAT     learning rate  [default: 0.001]
  --graph-mode BOOLEAN      TF run mode  [default: False]
  --distributed BOOLEAN     distributed training  [default: False]
  --help                    Show this message and exit.
  
  
>> python train_gpt2.py 
  --num-layers=8 
  --num-heads=8 
  --dff=3072 
  --embedding-size=768 
  --batch-size=32 
  --learning-rate=5e-5
  --graph-mode=True

在多个GPU上分发培训。

 >> python train_gpt2.py 
  --num-layers=8 
  --num-heads=8 
  --dff=3072 
  --embedding-size=768 
  --batch-size=32 
  --learning-rate=5e-5 
  --distributed=True 
  --graph-mode=True

通过命令行启动张板。

 $ tensorboard --logdir /log

预处理模型后，您可以通过为模型提供一些上下文来生成序列。打开此笔记本并加载验证的模型并传递上下文以模型它将返回生成的序列。

 $ sequence_generator.ipynb

做

 1. Parallel Preprocessing.
2. Shared weights across layers.
3. Factorized embedding.
4. Fine-Tuning wrapper.

参考：

“ OpenAI/GPT-2”
“拥抱面pytorch-transformer”
“ Tensorflow变形金刚”
“插图的GPT-2”

贡献

总是欢迎您的问题和公关。

作者

Abhay Kumar
作者电子邮件：[email protected]
在Twitter上关注我

执照

麻省理工学院

GPT-2模型的计算图。

展开

附加信息

版本 1.0.0
类型其他源码
更新时间 2025-03-11
大小 1.79MB
来自于 Github

gpt 2 tensorflow2.0

GPT-2预培训和文本生成，在Tensorflow 2.0中实现

iHuzu CMS v1.0 Beta12

恐怖冰淇淋82 .0版本黑客菜单

GPT影视最新版

WordPress v5.0 beta3

金博客 v2.0

Oauth2.0统一登录平台 v1.2

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express