xlnet Pytorch Unduh - xlnet Pytorch Source Code Unduh

xlnet Pytorch

Kode sumber lainnya

1.0.0

Unduh

XLNET-PYTORCH ARXIV: 1906.08237

Implementasi XLNET Sederhana dengan Pembungkus Pytorch!

Anda dapat melihat cara kerja arsitektur XLNET dalam pra-pelatihan dengan ukuran batch kecil (= 1) contoh.

Untuk digunakan

$ git clone https://github.com/graykode/xlnet-Pytorch && cd xlnet-Pytorch

# To use Sentence Piece Tokenizer(pretrained-BERT Tokenizer)
$ pip install pytorch_pretrained_bert

$ python main.py --data ./data.txt --tokenizer bert-base-uncased 
   --seq_len 512 --reuse_len 256 --perm_size 256 
   --bi_data True --mask_alpha 6 --mask_beta 1 
   --num_predict 85 --mem_len 384 --num_epoch 100

Anda juga dapat menjalankan kode di Google Colab dengan mudah.

Hyperparameters untuk pretraining di kertas.

Opsi ####

—data (String): .txt file untuk melatih. Tidak masalah teks multiline. Juga, satu file akan menjadi satu tensor batch. Default: data.txt
—tokenizer (string): Saya baru saja menggunakan tokenizer HuggingFace/Pytorch-Pretrained-Bert sebagai Tokenizer Subword (saya akan segera mengeditnya ke Kalimat). Anda dapat memilih dalam bert-base-uncased , bert-large-uncased , bert-base-cased , bert-large-cased . Default: bert-base-uncased
—seq_len (integer): Panjang urutan. Default: 512
—reuse_len (Interger): Jumlah token yang dapat digunakan kembali sebagai memori. Bisa setengah dari seq_len . Default: 256
—perm_size (Interger): Panjang permutasi terpanjang. Bisa diatur untuk reuse_len. Default: 256
--bi_data (BOOLEAN): Apakah akan membuat data dua arah. Jika bi_data True , biz(batch size) harus menjadi angka genap. Default: False
—mask_alpha (Interger): Berapa banyak token yang membentuk grup. Defalut: 6
—mask_beta (integer): Berapa banyak token untuk menutupi dalam setiap kelompok. Default: 1
—num_predict (Interger): BUM TOKEN untuk memprediksi. Dalam kertas, itu berarti prediksi parsial. Default: 85
—mem_len (Interger): Jumlah langkah untuk cache dalam arsitektur transformer-xl. Default: 384
—num_epoch (Interger): Jumlah zaman. Default: 100

Apa itu xlnet?

XLNET adalah metode pembelajaran representasi bahasa baru tanpa pengawasan berdasarkan pada tujuan pemodelan bahasa permutasi umum baru. Selain itu, XLNET menggunakan Transformer-XL sebagai model backbone, menunjukkan kinerja yang sangat baik untuk tugas-tugas bahasa yang melibatkan konteks yang panjang.

XLNET: pretraining autoregresif umum untuk pemahaman bahasa
Xlnet GitHub Penulis Kertas

Model	Mnli	Qnli	QQP	Rte	SST-2	Mrpc	Cola	STS-B
Bert	86.6	92.3	91.3	70.4	93.2	88.0	60.6	90.0
Xlnet	89.8	93.9	91.8	83.8	95.6	89.2	63.6	91.8

Kata kunci di xlnet

Bagaimana XLNET mendapat manfaat dari model regresi otomatis dan pengkodean otomatis?
- Model regresi otomatis
- Model enkoding otomatis
Pemodelan bahasa permutasi dengan prediksi parsial
- Pemodelan Bahasa Permutasi
- Prediksi parsial
Perhatian diri dua aliran dengan representasi target-sadar
- Perhatian diri sendiri
- Representasi Target-Sadar

Pengarang

Karena repositori asli tunduk pada lisensi APACHE2.0 , itu tunduk pada lisensi yang sama.
Tae Hwan Jung (Jeff Jung) @Graykode, Kyung Hee Univ CE (sarjana).
Email Penulis: [email protected]

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-04-16
ukuran 544.59KB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
pytorch image models

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Kode sumber lainnya

v1.1.0-rc-3

Informasi Terkait Semua