gpt 2 tensorflow2.0 Скачать - gpt 2 tensorflow2.0 Скачать исходный код

gpt 2 tensorflow2.0

Другой исходный код

1.0.0

Скачать

Предварительное обучение GPT-2 и генерация текста, реализованные в Tensorflow 2.0

Первоначально реализовано в Tensorflow 1.14 от Oapenai:- «OpenAI/GPT-2». Openai GPT-2 бумага:-«Языковые модели-это неконтролируемые многозадачные ученики»

** Этот репозиторий имеет реализацию OpenAI GPT-2 до тренировок и генерации последовательностей в TensorFlow 2.0, **

Требования

Python> = 3,6
Setuptools == 41.0.1
ftfy == 5.6
TQDM == 4.32.1
Нажмите == 7.0
Предложение == 0,1,83
tensorflow-gpu == 2.3.0
Numpy == 1.16.4

Настраивать

 $ git clone https://github.com/akanyaani/gpt-2-tensorflow2.0
$ cd gpt-2-tensorflow2.0
$ pip install -r requirements.txt

Вы можете предварительно провести модель, используя образцы данных, доступных в репозитории, или вы можете загрузить данные, используя этот GitHub Repo https://github.com/eukaryote31/openwebtext

Модель предварительного обучения на образце данных, доступных в репозитории

 $ python pre_process.py --help

Options:
  --data-dir TEXT        training data path  [default: /data/scraped]
  --vocab-size INTEGER   byte pair vocab size  [default: 24512]
  --min-seq-len INTEGER  minimum sequence length  [default: 15]
  --max-seq-len INTEGER  maximum sequence length  [default: 512]
  --help                 Show this message and exit.
  
  
>> python pre_process.py

Модель предварительного обучения на OpenWebText или любые другие данные

 >> python pre_process.py --data-dir=data_directory --vocab-size=32000

 $ python train_gpt2.py --help

Options:
  --num-layers INTEGER      No. of decoder layers  [default: 8]
  --embedding-size INTEGER  Embedding size  [default: 768]
  --num-heads INTEGER       Number of heads  [default: 8]
  --dff INTEGER             Filter Size  [default: 3072]
  --max-seq-len INTEGER     Seq length  [default: 515]
  --vocab-size INTEGER      Vocab size  [default: 24512]
  --optimizer TEXT          optimizer type  [default: adam]
  --batch-size INTEGER      batch size  [default: 8]
  --learning-rate FLOAT     learning rate  [default: 0.001]
  --graph-mode BOOLEAN      TF run mode  [default: False]
  --distributed BOOLEAN     distributed training  [default: False]
  --help                    Show this message and exit.
  
  
>> python train_gpt2.py 
  --num-layers=8 
  --num-heads=8 
  --dff=3072 
  --embedding-size=768 
  --batch-size=32 
  --learning-rate=5e-5
  --graph-mode=True

Распределенное обучение по нескольким графическим процессорам.

 >> python train_gpt2.py 
  --num-layers=8 
  --num-heads=8 
  --dff=3072 
  --embedding-size=768 
  --batch-size=32 
  --learning-rate=5e-5 
  --distributed=True 
  --graph-mode=True

Запустите Tensorboard через командную строку.

 $ tensorboard --logdir /log

После предварительной подготовки вашей модели вы можете генерировать последовательности, предоставив некоторый контекст для модели. Откройте это ноутбук и загрузите предварительную модель и пропустите контекст для модели, она вернет сгенерированную последовательность.

 $ sequence_generator.ipynb

Делать

 1. Parallel Preprocessing.
2. Shared weights across layers.
3. Factorized embedding.
4. Fine-Tuning wrapper.

Ссылки:

"OpenAI/GPT-2"
"Hurgingface Pytorch-трансформаторы"
"Тенсроффлуповые трансформаторы"
"Иллюстрированный GPT-2"

Вклад

Ваши проблемы и PR всегда приветствуются.

Автор

Абхай Кумар
Автор Электронная почта: [email protected]
Следуй за мной в Твиттере

Лицензия

Грань

График вычисления модели GPT-2.

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-03-11
размер 1.79MB
От Github

Связанные приложения

iHuzu CMS v1.0 Beta12

2024-11-14
Horror Ice Cream Версия 82.0 Взломанное Меню

2024-06-21
Последняя версия GPT для кино и телевидения

2023-10-30
WordPress v5.0 бета3

2022-07-05
Джинблог v2.0

2022-06-01
Единая платформа входа Oauth2.0 v1.2

2022-05-28

gpt 2 tensorflow2.0

Предварительное обучение GPT-2 и генерация текста, реализованные в Tensorflow 2.0

iHuzu CMS v1.0 Beta12

Horror Ice Cream Версия 82.0 Взломанное Меню

Последняя версия GPT для кино и телевидения

WordPress v5.0 бета3

Джинблог v2.0

Единая платформа входа Oauth2.0 v1.2

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express