gpt 2 tensorflow2.0ダウンロードgpt 2 tensorflow2.0ソースコードダウンロード

gpt 2 tensorflow2.0

その他のソースコード

1.0.0

ダウンロード

Tensorflow 2.0で実装されているGPT-2トレーニングおよびテキスト生成

もともとTensorflow 1.14でOapenaiによって実装されました： - 「Openai/GPT-2」。 Openai GPT-2ペーパー： - 「言語モデルは監視されていないマルチタスク学習者です」

**このリポジトリには、Tensorflow 2.0のOpenai GPT-2トレーニング前およびシーケンス生成実装があります**

要件

Python> = 3.6
setuptools == 41.0.1
ftfy == 5.6
TQDM == 4.32.1
== 7.0をクリックします
centepiece == 0.1.83
Tensorflow-gpu == 2.3.0
numpy == 1.16.4

設定

 $ git clone https://github.com/akanyaani/gpt-2-tensorflow2.0
$ cd gpt-2-tensorflow2.0
$ pip install -r requirements.txt

リポジトリで利用可能なサンプルデータを使用してモデルを事前にトレーニングできます。または、このGithub Repo https://github.com/eukaryote31/openwebtextを使用してデータをダウンロードできます。

リポジトリで利用可能なサンプルデータのトレーニング前モデル

 $ python pre_process.py --help

Options:
  --data-dir TEXT        training data path  [default: /data/scraped]
  --vocab-size INTEGER   byte pair vocab size  [default: 24512]
  --min-seq-len INTEGER  minimum sequence length  [default: 15]
  --max-seq-len INTEGER  maximum sequence length  [default: 512]
  --help                 Show this message and exit.
  
  
>> python pre_process.py

OpenWebtextまたはその他のデータに関するトレーニング前モデル

 >> python pre_process.py --data-dir=data_directory --vocab-size=32000

 $ python train_gpt2.py --help

Options:
  --num-layers INTEGER      No. of decoder layers  [default: 8]
  --embedding-size INTEGER  Embedding size  [default: 768]
  --num-heads INTEGER       Number of heads  [default: 8]
  --dff INTEGER             Filter Size  [default: 3072]
  --max-seq-len INTEGER     Seq length  [default: 515]
  --vocab-size INTEGER      Vocab size  [default: 24512]
  --optimizer TEXT          optimizer type  [default: adam]
  --batch-size INTEGER      batch size  [default: 8]
  --learning-rate FLOAT     learning rate  [default: 0.001]
  --graph-mode BOOLEAN      TF run mode  [default: False]
  --distributed BOOLEAN     distributed training  [default: False]
  --help                    Show this message and exit.
  
  
>> python train_gpt2.py 
  --num-layers=8 
  --num-heads=8 
  --dff=3072 
  --embedding-size=768 
  --batch-size=32 
  --learning-rate=5e-5
  --graph-mode=True

複数のGPUに関する分散トレーニング。

 >> python train_gpt2.py 
  --num-layers=8 
  --num-heads=8 
  --dff=3072 
  --embedding-size=768 
  --batch-size=32 
  --learning-rate=5e-5 
  --distributed=True 
  --graph-mode=True

コマンドラインからテンソルボードを開始します。

 $ tensorboard --logdir /log

モデルを前処理した後、モデルにコンテキストを提供することにより、シーケンスを生成できます。このノートブックを開き、前処理されたモデルをロードし、コンテキストを合格してモデル化し、生成されたシーケンスを返します。

 $ sequence_generator.ipynb

やる

 1. Parallel Preprocessing.
2. Shared weights across layers.
3. Factorized embedding.
4. Fine-Tuning wrapper.

参考文献：

「Openai/GPT-2」
「Huggingface pytorch-transformers」
「Tensorflow Transformers」
「イラスト付きGPT-2」

貢献

あなたの問題とPRはいつでも大歓迎です。

著者

Abhay Kumar
著者のメール：[email protected]
Twitterでフォローしてください

ライセンス

mit

GPT-2モデルの計算グラフ。

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-03-11
サイズ 1.79MB
から Github

gpt 2 tensorflow2.0

Tensorflow 2.0で実装されているGPT-2トレーニングおよびテキスト生成

iHzu CMS v1.0 ベータ 12

ホラーアイスクリームバージョン82.0のハッキングメニュー

GPT 映画とテレビの最新バージョン

WordPress v5.0 ベータ 3

ジンブログ v2.0

Oauth2.0 統合ログインプラットフォーム v1.2

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express