gpt 2 simpleダウンロードgpt 2 simpleソースコードダウンロード

gpt 2 simple

その他のソースコード

v0.8.1: Tensor

ダウンロード

GPT-2-シンプル

gen_demo

OpenAIのGPT-2テキスト生成モデル（具体的には「小」124mおよび「中」355mハイパーパラメーターバージョン）の既存のモデルの微調整および生成スクリプトをラップするシンプルなPythonパッケージ。さらに、このパッケージを使用すると、テキストの生成が容易になり、簡単にキュレーションのためにファイルに生成され、プレフィックスが特定のフレーズでテキストを強制的に開始させます。

このパッケージには、以下に最小限の低レベルの変更が組み込まれています。

Openaiの公式GPT-2 Repo（MITライセンス）からのモデル管理
Neil ShepperdのGPT-2のフォークからのモデルFinetuning（MITライセンス）
textgenrnnからのテキスト生成出力管理（MITライセンス /私によって作成された）

Finetuningの場合、GPUを使用することを強くお勧めしますが、CPUを使用して生成できます（はるかにゆっくりですが）。クラウドでトレーニングをしている場合は、Colaboratory NotebookまたはTensorflow Deep Learningイメージを備えたGoogle Compute Engine VMを使用して強くお勧めします。（GPT-2モデルがGCPでホストされているため）

GPT-2-SIMPLEを使用して、このコラボリトリーノートブックでGPUを無料で使用してモデルを再訓練することができます。

注：GPT-2-Simpleの開発は、より効率的なトレーニング時間とリソースの使用を備えた同様のAIテキスト生成機能を備えたAitextgenによって主に重ねられています。 Tensorflowを使用する必要がない場合は、代わりにAitextgenを使用することをお勧めします。 GPT-2-Simpleを使用してトレーニングされたチェックポイントは、Aitextgenを使用してロードできます。

インストール

GPT-2-Simpleは、Pypi経由でインストールできます。

pip3 install gpt-2-simple

また、システムに対応するTensorflow 2.xバージョン（min 2.5.1）をインストールする必要があります（ tensorflowまたはtensorflow-gpuなど）。

使用法

モデルをローカルシステムにダウンロードする例で、データセットで微調整します。テキストを生成します。

警告：前払いされた124mモデル、したがって触覚モデルは500 MBです！（前提条件の355mモデルは1.5 GBです）

 import gpt_2_simple as gpt2
import os
import requests

model_name = "124M"
if not os . path . isdir ( os . path . join ( "models" , model_name )):
	print ( f"Downloading { model_name } model..." )
	gpt2 . download_gpt2 ( model_name = model_name )   # model is saved into current directory under /models/124M/


file_name = "shakespeare.txt"
if not os . path . isfile ( file_name ):
	url = "https://raw.githubusercontent.com/karpathy/char-rnn/master/data/tinyshakespeare/input.txt"
	data = requests . get ( url )

	with open ( file_name , 'w' ) as f :
		f . write ( data . text )


sess = gpt2 . start_tf_sess ()
gpt2 . finetune ( sess ,
              file_name ,
              model_name = model_name ,
              steps = 1000 )   # steps is max number of training steps

gpt2 . generate ( sess )

生成されたモデルチェックポイントは、デフォルトで/checkpoint/run1です。そのフォルダーからモデルをロードし、そこからテキストを生成する場合：

 import gpt_2_simple as gpt2

sess = gpt2 . start_tf_sess ()
gpt2 . load_gpt2 ( sess )

gpt2 . generate ( sess )

TextGenrnnと同様に、 return_as_listパラメーターを使用して、後で使用するためにテキストを生成および保存することができます（APIまたはボットなど）。

 single_text = gpt2 . generate ( sess , return_as_list = True )[ 0 ]
print ( single_text )

checkpointフォルダーに複数のモデルを保存/ロードする場合は、 run_nameパラメーターをfinetuneおよびload_gpt2に渡すことができます。

また、FinetuningとGenerationの両方にコマンドラインインターフェイスがあり、クラウドVM w/ GPUで実行するだけの強力なデフォルトがあります。 Finetuningの場合（存在しない場合はモデルもダウンロードします）：

gpt_2_simple finetune shakespeare.txt

そして、 genフォルダー内のファイルにテキストを生成する世代の場合：

gpt_2_simple generate

関数で利用可能な同じパラメーターのほとんどは、CLI引数として利用可能です。

gpt_2_simple generate --temperature 1.0 --nsamples 20 --batch_size 20 --length 50 --prefix " <|startoftext|> " --truncate " <|endoftext|> " --include_prefix False --nfiles 5

以下を参照して、CLIの引数のいくつかが何をしているかを確認してください。

NB：別のデータセットでFinetuneまたは別のモデルをロードする場合は、最初にPythonセッションを再起動します。

GPT-2-シンプルと他のテキスト生成ユーティリティの違い

GPT-2がテキストを生成するために使用するメソッドは、TextGenrnnのような他のパッケージのようなものとはわずかに異なります（特に、GPUで純粋にフルテキストシーケンスを生成し、後でデコードする）。基礎となるモデルコードをハッキングせずに簡単に修正できません。結果として：

一般に、GPT-2は、世代全体の長さにわたってコンテキストを維持するのに優れており、会話のテキストを生成するのに適しています。また、テキストは一般的に文法的に正しいものであり、適切な資本化とほとんどのタイポベがあります。
元のGPT-2モデルは、非常に多種多様なソースでトレーニングされており、モデルが入力テキストには見られないイディオムを組み込むことができます。
GPT-2は、リクエストごとに最大1024トークンしか生成できません（英語テキストの約3〜4段落）。
GPT-2は、特定のエンドトークンに到達してから早期に停止できません。（回避策： truncateパラメーターをgenerate関数に渡して、指定されたエンドトークンまでテキストを収集します。適切にlengthを減らすことができます。）
より高い温度はより良く動作し（0.7-1.0）、より興味深いテキストを生成しますが、他のフレームワークは0.2-0.5の間でうまく機能します。
GPT-2を微調整する場合、より大きなテキスト内のドキュメントの開始または終了の感覚はありません。オーダーメイドの文字シーケンスを使用して、ドキュメントの開始と終了を示す必要があります。次に、生成中に、開始トークンシーケンスをターゲットとするprefixと、終了トークンシーケンスをターゲットとするtruncateを指定できます。 include_prefix=Falseを設定して、生成中にプレフィックストークンを破棄することもできます（例： <|startoftext|>のような不要なものの場合）。
単一列.csvファイルをfinetune()に渡すと、CSVをGPT-2でトレーニングするのに最適な形式に自動的に解析されます（ <|startoftext|> suffixing <|endoftext|>をすべてのテキストドキュメントに送信するため、上記のtruncateトリックは出力を生成するときに役立ちます）。これは、各テキストドキュメントの引用符とニューラインの両方を正しく処理するために必要です。
GPT-2を使用すると、 nsamplesに分割できるbatch_sizeを設定することにより、並行してテキストを生成でき、生成がはるかに高速になります。 GPUで非常にうまく機能します（ColaboratoryのK80でbatch_size最大20まで設定できます）！
GPT-2のアーキテクチャにより、より強力なGPUでうまく拡大します。 124mモデルの場合、長期間トレーニングしたい場合、GCPのP100 GPUは価格の3倍でK80/T4よりも約3倍高速で、価格と比較可能になります（V100はP100よりも約1.5倍高速ですが、価格は約2倍です）。 P100はbatch_size=1 、およびV100 GPUの約88％でもGPUの100％を使用しています。
部分的にトレーニングされたGPT-2モデルがあり、Finetuningを継続したい場合は、finetuneにoverwrite=Trueを設定します。これにより、複製コピーを作成せずにトレーニングを継続し、モデルの以前の反復を削除できます。これは、転送学習に特に役立ちます（1つのデータセットでGPT-2を大量にFintune GPT-2、その後、他のデータセットでFinetuneで両方のデータセットの「マージ」を取得します）。
入力テキストデータセットが巨大な場合（> 100 MB）場合、 gpt2.encode_dataset(file_path)を使用してデータセットを事前エンコードして圧縮することをお勧めします。出力は圧縮された.npzファイルで、FinetuningのためにGPUにはるかに速くロードされます。
774mの「大規模」モデルは、最新のGPUがメモリを外に出現させるため、FineTuningをサポートする可能性があります（コラボラトリーでP100 GPUを使用すると幸運になるかもしれません）。ただし、 gpt2.load_gpt2(sess, model_name='774M')およびgpt2.generate(sess, model_name='774M')を使用して、デフォルトの事前処理モデルから引き続き生成できます。
1558mの「余分な大規模」である真のモデルは、Colaboratory Notebookに含まれているGPUを使用して、すぐに機能しない場合があります。最適な構成を特定するには、さらにテストが必要です。

GPT-2-Simpleを使用したインタラクティブなアプリ

gpt2-small - デフォルトのGPT-2 124m事前処理されたモデルを使用したアプリ
GPT2-REDDIT - 指定されたsubredditおよび/またはキーワードに基づいてRedditタイトルを生成するアプリ
GPT2-MTG - マジックを生成するアプリ：ギャザリングカード

GPT-2-シンプルを使用したテキスト生成の例

RESETERA - 生成されたビデオゲームフォーラムディスカッション（github w/ dumps）
/r/legalAdvice - タイトル生成（github w/dumps）
ハッカーニュース - 何万もの生成されたハッカーニュースの提出タイトル

メンテナー/クリエーター

マックスウルフ（@minimaxir）

マックスのオープンソースプロジェクトは、彼のパトレオンによってサポートされています。このプロジェクトが役立つと感じた場合、パトレオンへの金銭的貢献は高く評価されており、創造的な使用になります。

ライセンス

mit

免責事項

このレポは、Openaiとの所属や関係はありません。

拡大する

追加情報

バージョン v0.8.1: Tensor
タイプその他のソースコード
更新時間 2025-03-02
サイズ 110.87KB
から Github

gpt 2 simple

GPT-2-シンプル

インストール

使用法

GPT-2-シンプルと他のテキスト生成ユーティリティの違い

GPT-2-Simpleを使用したインタラクティブなアプリ

GPT-2-シンプルを使用したテキスト生成の例

メンテナー/クリエーター

ライセンス

免責事項

simple video downloader

filament simple theme

シンプルな PHP ブログ

シンプルなグループウェア

CMS をシンプルに

シンプル黒板2 オリンピック特別版

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf