torchKbert ดาวน์โหลด - ดาวน์โหลดซอร์สโค้ด torchKbert

torchKbert

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

Torchkbert

Bert สำหรับ Pytorch เวอร์ชันที่กำหนดเองของเรา

อธิบาย

นี่คือห้องสมุดโมเดลที่ฉันได้ปรับแต่งและดัดแปลงบางส่วนตามห้องสมุด Pytorch_pretrained_bert ของ Meelfy

ความตั้งใจดั้งเดิมของโครงการนี้คือการตอบสนองความสะดวกของการทดลองส่วนบุคคลดังนั้นจึงไม่ได้รับการปรับปรุงบ่อยครั้ง

การทำงาน

ฟังก์ชั่นในห้องสมุดโมเดลดั้งเดิม pytorch_pretrained_bert ยังคงได้รับการสนับสนุน;
รองรับการเข้ารหัสตำแหน่งการสลายตัวแบบลำดับชั้น
รองรับ Wobert ตามคำว่า granularity น้ำหนัก Pytorch (รุ่น Wobert Plus มีให้ที่นี่):
- chinese_wobert_plus.zip (รหัสการแยก: fg6j)

ใช้

ติดตั้ง:
```
pip install torchKbert
```
สำหรับตัวอย่างการใช้งานทั่วไปโปรดดูที่ไดเรกทอรีตัวอย่างอย่างเป็นทางการ
หากคุณต้องการใช้การเข้ารหัสตำแหน่งการสลายตัวแบบลำดับชั้นเพื่อให้เบิร์ตสามารถประมวลผลข้อความยาวเพียงแค่ผ่านพารามิเตอร์ is_hierarchical=True ใน model ตัวอย่างมีดังนี้:
```
 model = BertModel(config)
encoder_outputs, _ = model(input_ids, token_ids, input_mask, is_hierarchical=True)
```
หากคุณต้องการใช้ WoBert จีนตามคำที่มีความละเอียดเพียงแค่ผ่านพารามิเตอร์ใหม่เมื่อสร้างวัตถุ BertTokenizer :
```
 from torchKbert.tokenization import BertTokenizer

tokenizer = BertTokenizer(
    vocab_file=vocab_path, 
    pre_tokenizer=lambda s: jieba.cut(s, HMM=False))
```
เมื่อไม่ผ่านเข้ามาค่าเริ่มต้นคือ None เมื่อมีการใช้คำเป็นส่วน ๆ ค่าเริ่มต้นจะถูกใช้เป็นคำ หากคุณต้องการกู้คืนการใช้หน่วยคำเพียงแค่ผ่านในพารามิเตอร์ใหม่ pre_tokenize=False เมื่อ tokenize :
```
 tokenzier.tokenize(text, pre_tokenize=False)
```

พื้นหลัง

ฉันเคยเขียน pytorch_pretrained_bert ใน Meelfy มาก่อนและมันสะดวกมากที่จะเรียกนางแบบ pretrained หรือทำการปรับแต่งอย่างละเอียด ต่อมาเนื่องจากความต้องการส่วนบุคคลฉันต้องการเขียนเวอร์ชันที่รองรับการเข้ารหัสตำแหน่งการสลายตัวแบบลำดับชั้น

Bert4keras ของ Sushen ได้ใช้ฟังก์ชั่นดังกล่าว แต่เนื่องจากฉันคุ้นเคยกับการใช้ Pytorch ฉันไม่ได้ใช้ Keras มานานดังนั้นฉันจึงวางแผนที่จะเขียนใหม่ด้วยตัวเอง

ต่ออายุ

2021.03.07 : เพิ่มการเข้ารหัสตำแหน่งการสลายตัวแบบลำดับชั้น
2021.05.27 : เพิ่ม Wobert จีนตามคำที่ละเอียด
2022.03.27 : อ้างถึง pytorch_transformers เพื่อปรับใช้รหัส BertpretrainedModel

อ้างถึง

ขอบคุณการใช้งานของ Meelfy ที่ Pytorch_pretrained_bert การใช้งานนี้ขึ้นอยู่กับซอร์สโค้ดของ pytorch_pretrained_bert ทั้งหมด
ขอบคุณ Su Shen สำหรับการแบ่งปันข้อมูลเชิงลึกและการเสียสละของเขา: การเข้ารหัสตำแหน่งการสลายตัวแบบลำดับชั้นช่วยให้เบิร์ตสามารถประมวลผลข้อความยาวเป็นพิเศษ
Wobert: Model Bert จีนตามคำ - Zhuiyiai

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-08
ขนาด 85.53KB
มาจาก Github

แอปที่เกี่ยวข้อง

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด