xlnet Pytorchダウンロードxlnet Pytorchソースコードのダウンロード

xlnet Pytorch

その他のソースコード

1.0.0

ダウンロード

xlnet-pytorch arxiv：1906.08237

Pytorchラッパーを使用したシンプルなXLNET実装！

XLNETアーキテクチャが小さなバッチサイズ（= 1）の例でトレーニング前でどのように機能するかを見ることができます。

使用する

$ git clone https://github.com/graykode/xlnet-Pytorch && cd xlnet-Pytorch

# To use Sentence Piece Tokenizer(pretrained-BERT Tokenizer)
$ pip install pytorch_pretrained_bert

$ python main.py --data ./data.txt --tokenizer bert-base-uncased 
   --seq_len 512 --reuse_len 256 --perm_size 256 
   --bi_data True --mask_alpha 6 --mask_beta 1 
   --num_predict 85 --mem_len 384 --num_epoch 100

また、Google Colabでコードを簡単に実行できます。

紙中の事前供与のためのハイパーパラメーター。

＃＃＃＃オプション

—data （String）：. .txtファイルをトレーニングします。マルチラインテキストは問題ではありません。また、1つのファイルは1つのバッチテンソルになります。デフォルト： data.txt
—tokenizer （String）：Huggingface/Pytorch-Preatreaded-Berteのトークンザーをサブワードトークイザーとして使用しました（すぐに文に編集します）。 bert-base-uncased 、 bert-large-uncased 、 bert-base-cased 、 bert-large-casedで選択できます。デフォルト： bert-base-uncased
—seq_len （整数）：シーケンス長。デフォルト： 512
—reuse_len （Interger）：メモリとして再利用できるトークンの数。 seq_lenの半分になる可能性があります。デフォルト： 256
—perm_size （Interger）：最長の順列の長さ。 reuse_lenになるように設定できます。デフォルト： 256
--bi_data （boolean）：双方向データを作成するかどうか。 bi_dataがTrueある場合、 biz(batch size)偶数でなければなりません。デフォルト： False
—mask_alpha （Interger）：グループを形成するためのトークンの数。 defalut： 6
—mask_beta （整数）：各グループ内でマスクするトークンの数。デフォルト： 1
—num_predict （Interger）：予測するトークンの数。紙では、部分的な予測を意味します。デフォルト： 85
—mem_len （Interger）：Transform-XLアーキテクチャでキャッシュするステップ数。デフォルト： 384
—num_epoch （Interger）：エポックの数。デフォルト： 100