ดาวน์โหลด xlnet Pytorch - xlnet Pytorch ซอร์สโค้ดดาวน์โหลดดาวน์โหลด

xlnet Pytorch

ซอร์สโค้ดอื่น ๆ

1.0.0

ดาวน์โหลด

XLNET-PYTORCH ARXIV: 1906.08237

การใช้งาน XLNET อย่างง่ายด้วย wrapper pytorch!

คุณสามารถดูว่าสถาปัตยกรรม XLNet ทำงานอย่างไรในการฝึกอบรมล่วงหน้าด้วยขนาดแบทช์ขนาดเล็ก (= 1) ตัวอย่าง

เพื่อการใช้งาน

$ git clone https://github.com/graykode/xlnet-Pytorch && cd xlnet-Pytorch

# To use Sentence Piece Tokenizer(pretrained-BERT Tokenizer)
$ pip install pytorch_pretrained_bert

$ python main.py --data ./data.txt --tokenizer bert-base-uncased 
   --seq_len 512 --reuse_len 256 --perm_size 256 
   --bi_data True --mask_alpha 6 --mask_beta 1 
   --num_predict 85 --mem_len 384 --num_epoch 100

นอกจากนี้คุณสามารถเรียกใช้รหัสใน Google Colab ได้อย่างง่ายดาย

ไฮเปอร์พารามิเตอร์สำหรับการเตรียมการในกระดาษ

#### ตัวเลือก

—data (สตริง):. .txt ไฟล์เพื่อฝึกอบรม มันไม่สำคัญว่าข้อความหลายเส้น นอกจากนี้ไฟล์หนึ่งไฟล์จะเป็นหนึ่งชุดเทนเซอร์ ค่าเริ่มต้น: data.txt
—tokenizer (String): ฉันเพิ่งใช้ huggingface/pytorch-pretrained-tokenizer ของ Bert เป็น subword tokenizer (ฉันจะแก้ไขเป็นชิ้นส่วนประโยคเร็ว ๆ นี้) คุณสามารถเลือกได้ใน bert-base-uncased , bert-large-uncased , bert-base-cased , bert-large-cased ค่าเริ่มต้น: bert-base-uncased
—seq_len (จำนวนเต็ม): ความยาวลำดับ ค่าเริ่มต้น: 512
—reuse_len (interger): จำนวนโทเค็นที่สามารถนำกลับมาใช้ใหม่เป็นหน่วยความจำ อาจเป็นครึ่งหนึ่งของ seq_len ค่าเริ่มต้น: 256
—perm_size (Interger): ความยาวของการเปลี่ยนแปลงที่ยาวที่สุด สามารถตั้งค่าให้เป็น reuse_len ค่าเริ่มต้น: 256
--bi_data (บูลีน): ไม่ว่าจะสร้างข้อมูลแบบสองทิศทางหรือไม่ หาก bi_data เป็น True biz(batch size) ควรเป็นจำนวน ค่าเริ่มต้น: False
—mask_alpha (Interger): จำนวนโทเค็นในการสร้างกลุ่ม defalut: 6
—mask_beta (จำนวนเต็ม): มีโทเค็นจำนวนเท่าใดที่จะหน้ากากภายในแต่ละกลุ่ม ค่าเริ่มต้น: 1
—num_predict (Interger): จำนวนโทเค็นที่จะทำนาย ในกระดาษมันหมายถึงการทำนายบางส่วน ค่าเริ่มต้น: 85
—mem_len (Interger): จำนวนขั้นตอนในการแคชในสถาปัตยกรรม Transformer-XL ค่าเริ่มต้น: 384
—num_epoch (Interger): จำนวนยุค ค่าเริ่มต้น: 100

xlnet คืออะไร?

XLNET เป็นวิธีการเรียนรู้การเป็นตัวแทนภาษาที่ไม่ได้รับการดูแลใหม่โดยใช้วัตถุประสงค์การสร้างแบบจำลองภาษาการเปลี่ยนแปลงทั่วไปแบบใหม่ นอกจากนี้ XLNET ยังใช้ Transformer-XL เป็นโมเดล Backbone ซึ่งแสดงประสิทธิภาพที่ยอดเยี่ยมสำหรับงานภาษาที่เกี่ยวข้องกับบริบทที่ยาวนาน

XLNET: การเตรียมการโดยอัตโนมัติเพื่อความเข้าใจภาษาทั่วไป
XLNet GitHub ของผู้เขียนกระดาษ

แบบอย่าง	mnli	qnli	qqp	rte	SST-2	MRPC	โคล่า	STS-B
เบิร์ต	86.6	92.3	91.3	70.4	93.2	88.0	60.6	90.0
xlnet	89.8	93.9	91.8	83.8	95.6	89.2	63.6	91.8

คำหลักใน xlnet

XLNet ได้รับประโยชน์จากโมเดลการถดถอยอัตโนมัติและการเข้ารหัสอัตโนมัติอย่างไร
- โมเดลการฟื้นฟูอัตโนมัติ
- รูปแบบการเข้ารหัสอัตโนมัติ
การสร้างแบบจำลองภาษาแบบเปลี่ยนรูปด้วยการทำนายบางส่วน
- การสร้างแบบจำลองภาษาแบบเปลี่ยนรูป
- การทำนายบางส่วน
การตั้งใจด้วยตนเองสองสตรีมด้วยการเป็นตัวแทนที่ตระหนักถึงเป้าหมาย
- ความตั้งใจของตนเองสองสเตรต
- การเป็นตัวแทนที่ตระหนักถึงเป้าหมาย

ผู้เขียน

เนื่องจากพื้นที่เก็บข้อมูลดั้งเดิมอยู่ภายใต้ ใบอนุญาต Apache2.0 จึงต้องได้รับใบอนุญาตเดียวกัน
Tae Hwan Jung (Jeff Jung) @graykode, Kyung Hee Univ CE (ปริญญาตรี)
อีเมลผู้แต่ง: [email protected]

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท ซอร์สโค้ดอื่น ๆ
เวลาอัปเดต 2025-04-16
ขนาด 544.59KB
มาจาก Github

แอปที่เกี่ยวข้อง

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
pytorch image models

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด