gpt 2 simple下载gpt 2 simple源代码下载

gpt 2 simple

其他源码

v0.8.1: Tensor

下载

gpt-2-simple

gen_demo

一个简单的Python软件包，它包含OpenAI的GPT-2文本生成模型的现有模型微调和生成脚本（特别是“ Small” 1.24m和“ Medium” 35.5m超参数版本）。此外，此软件包允许更轻松地生成文本，生成文件以易于策划，从而使前缀迫使文本以给定的短语开始。

此包包含并使最小的低级更改为：

OpenAI官方GPT-2 Repo（MIT许可证）的模型管理
尼尔·谢珀德（Neil Shepperd）的GPT-2叉（MIT许可证）
TextGenrnn的文本生成输出管理（MIT许可 /也由我创建）

对于Finetuning，强烈建议使用GPU，尽管您可以使用CPU生成（尽管较慢）。如果您在云中进行训练，请强烈建议使用配色笔记本或Google Compute Engine VM（带张量深度学习图像）。（由于GPT-2模型托管在GCP上）

您可以在此合同的笔记本中使用GPU免费使用GPP-2-simple对模型进行重新训练，该笔记本也可以将包装的其他功能演示。

注意：gpt-2-simple上的开发主要是由Aitextgen取代的，AITEXTGEN具有类似的AI文本生成功能，具有更有效的培训时间和资源使用时间。如果您不需要使用TensorFlow，建议您改用AitextGen。也可以使用AITEXTGEN加载使用GPT-2-simple训练的检查点。

安装

可以通过PYPI安装GPT-2简单：

pip3 install gpt-2-simple

您还需要为系统安装相应的Tensorflow 2.x版本（Min 2.5.1）（例如tensorflow或tensorflow-gpu ）。

用法

将模型下载到本地系统的示例，将其在数据集上进行列表。并生成一些文字。

警告：预处理的12400万型号，因此任何易登模型的模型为500 MB！（预估计的355m型号为1.5 GB）

 import gpt_2_simple as gpt2
import os
import requests

model_name = "124M"
if not os . path . isdir ( os . path . join ( "models" , model_name )):
	print ( f"Downloading { model_name } model..." )
	gpt2 . download_gpt2 ( model_name = model_name )   # model is saved into current directory under /models/124M/


file_name = "shakespeare.txt"
if not os . path . isfile ( file_name ):
	url = "https://raw.githubusercontent.com/karpathy/char-rnn/master/data/tinyshakespeare/input.txt"
	data = requests . get ( url )

	with open ( file_name , 'w' ) as f :
		f . write ( data . text )


sess = gpt2 . start_tf_sess ()
gpt2 . finetune ( sess ,
              file_name ,
              model_name = model_name ,
              steps = 1000 )   # steps is max number of training steps

gpt2 . generate ( sess )

生成的模型检查点默认为/checkpoint/run1 。如果要从该文件夹加载模型并从中生成文本：

 import gpt_2_simple as gpt2

sess = gpt2 . start_tf_sess ()
gpt2 . load_gpt2 ( sess )

gpt2 . generate ( sess )

与TextGenrnn一样，您可以使用return_as_list参数生成并保存文本以供以后使用（例如API或BOT）。

 single_text = gpt2 . generate ( sess , return_as_list = True )[ 0 ]
print ( single_text )

如果要在checkpoint文件夹中存储/加载多个模型，则可以将run_name参数传递给finetune和load_gpt2 。

还有一个命令行界面，用于FineTuning和Generation，surn of flaunting和GENTERS的生成符号仅在cloud VM w/ gpu上运行。对于登录（如果不存在的话，也将下载该模型）：

gpt_2_simple finetune shakespeare.txt

对于Generation，它在gen文件夹中生成了文件的文本：

gpt_2_simple generate

功能中可用的大多数相同参数都可以作为CLI参数，例如：

gpt_2_simple generate --temperature 1.0 --nsamples 20 --batch_size 20 --length 50 --prefix " <|startoftext|> " --truncate " <|endoftext|> " --include_prefix False --nfiles 5

请参阅下面查看一些CLI论点。

NB：如果要在另一个数据集上进行FINETUNE或加载另一个模型，请首先重新启动Python会话。

GPT-2-simple和其他文本生成公用事业之间的差异

GPT-2用于生成文本的方法与像TextGenrnn这样的其他软件包（特别是，纯粹在GPU中生成全文序列并稍后将其解码）略有不同，在不侵入基础模型代码的情况下，它无法轻易修复。因此：

通常，GPT-2更好地维持整个生成长度的上下文，从而使其适合生成对话文本。文本通常在晶状体上是正确的，具有适当的大写字母，几乎没有错别字。
对原始的GPT-2模型进行了各种各样的培训，使该模型可以合并输入文本中未见的成语。
GPT-2每个请求最多只能生成1024个令牌（大约3-4个英语文本）。
GPT-2无法在达到特定的端代币后尽早停止。（解决方法：将truncate参数传递到generate函数仅收集文本，直到指定的末端令牌为止。您可能需要适当地减少length 。）
较高的温度效果更好（例如0.7-1.0），以生成更多有趣的文本，而其他框架在0.2-0.5之间更好地工作。
当对GPT-2进行填充时，它没有对较大文本中文档的开始或结尾的感觉。您需要使用定制字符序列来指示文档的开始和结尾。然后，在生成时，您可以指定针对开始令牌序列的prefix ，以及针对末端令牌序列的truncate 。您还可以在生成时设置include_prefix=False以丢弃前缀令牌（例如，如果它是不需要的东西，例如<|startoftext|> ）。
如果将单列.csv文件传递到finetune() ，则它将自动将CSV解析为使用GPT-2培训的格式（包括Preperding <|startoftext|>和后缀<|endoftext|>对每个文本文档，因此上面的truncate技巧在生成输出时很有用）。这对于正确处理每个文本文档中的引号和新线是必要的。
GPT-2允许您通过设置可分开nsamples batch_size并行生成文本，从而导致生成更快。与GPU一起工作非常好（可以在Colaboratory的K80上设置最多20个batch_size ）！
由于GPT-2的架构，它可以通过更强大的GPU来很好地扩展。对于1.24m型号，如果您想训练更长的时间，GCP的P100 GPU的价格仅比K80/T4快3倍，价格仅为3倍，从而使价格相稳定（V100比P100快1.5倍，但价格约为2倍）。即使在batch_size=1和V100 GPU的约88％的情况下，P100即使使用GPU的100％。
如果您具有部分训练的GPT-2模型并希望继续进行FINETUNTUN，则可以将overwrite=True设置为Finetune，该模型将继续训练并删除模型的先前迭代而不创建重复副本。这对于转移学习特别有用（例如，一个数据集上的finetune gpt-2，然后在另一个数据集上的finetune以获取两个数据集的“合并”）。
如果您的输入文本数据集很大（> 100 MB），则可能需要使用gpt2.encode_dataset(file_path)预先键盘并压缩数据集。输出是一个压缩的.npz文件，它将加载到GPU中以进行填充。
774m的“大型”模型可能会支持芬太尼，因为它会导致现代GPU变得过时（如果您在Colaboratory使用P100 GPU）可能会很幸运）。但是，您仍然可以使用gpt2.load_gpt2(sess, model_name='774M')和gpt2.generate(sess, model_name='774M')从默认的预审预修模型生成。
1558m的“超大型”，真实的模型，可能无法使用ColaBoratory Notebook随附的GPU进行工作。需要进行更多测试来确定其最佳配置。

使用gpt-2-simple的交互式应用

GPT2-SMALL - 使用默认GPT-2 124M预算模型的应用
GPT2-REDDIT - 基于指定的subreddit和/或关键字生成reddit标题的应用
GPT2-MTG - 生成魔术的应用：聚会卡

使用gpt-2-simple的文本生成示例

RESETERA - 生成的视频游戏论坛讨论（github w/ dumps）
/r/LegalAdvice - 标题生成（github w/dumps）
黑客新闻 - 成千上万的黑客新闻提交标题

维护者/创建者

Max Woolf（@minimaxir）

Max的开源项目得到了他的Patreon的支持。如果您发现该项目有帮助，那么对Patreon的任何货币捐款都将受到赞赏，并将得到良好的创造性使用。

执照

麻省理工学院

免责声明

此存储库与Openai没有隶属关系或关系。

展开

附加信息

版本 v0.8.1: Tensor
类型其他源码
更新时间 2025-03-02
大小 110.87KB
来自于 Github

gpt 2 simple

gpt-2-simple

安装

用法

GPT-2-simple和其他文本生成公用事业之间的差异

使用gpt-2-simple的交互式应用

使用gpt-2-simple的文本生成示例

维护者/创建者

执照

免责声明

simple video downloader

filament simple theme

简单的 PHP 博客

简单的组件

CMS 变得简单

Simple涂乌板2 奥运特别版

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf