ดาวน์โหลด Multi dialect Arabic BERT - Multi dialect Arabic BERT Source Source Download

Multi dialect Arabic BERT

โค้ดแหล่งที่มา AI

1.0.0

ดาวน์โหลด

มัลติเพ้นท์-อาหรับ-เบิร์ต

นี่คือพื้นที่เก็บข้อมูลของแบบจำลองอาหรับเบิร์ตแบบหลายจุด

โดย Mawdoo3-ai

การอ้างอิงพื้นหลัง: http://www.qfi.org/wp-content/uploads/2018/02/qfi_infographic_mother-language_final.pdf

เกี่ยวกับโมเดล Multi-Dialect-Arabic-Bert ของเรา

แทนที่จะฝึกอบรมแบบจำลองอาหรับเบิร์ตแบบหลายจุดเริ่มต้นจากศูนย์เราเริ่มต้นน้ำหนักของแบบจำลองโดยใช้ภาษาอาหรับ-เบิร์ตและฝึกฝนในทวีตอาหรับ 10M จากข้อมูลที่ไม่ได้ใช้งานของงานภาษาอาหรับที่มีความเหมาะสม (NADI) ที่ใช้ร่วมกัน

เพื่ออ้างถึงงานนี้

 @misc{talafha2020multidialect,
    title={Multi-Dialect Arabic BERT for Country-Level Dialect Identification},
    author={Bashar Talafha and Mohammad Ali and Muhy Eddin Za'ter and Haitham Seelawi and Ibraheem Tuffaha and Mostafa Samir and Wael Farhan and Hussein T. Al-Natsheh},
    year={2020},
    eprint={2007.05612},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

การใช้งาน

น้ำหนักรุ่นสามารถโหลดได้โดยใช้ไลบรารี transformers โดย HuggingFace

 from transformers import AutoTokenizer , AutoModel

tokenizer = AutoTokenizer . from_pretrained ( "bashar-talafha/multi-dialect-bert-base-arabic" )
model = AutoModel . from_pretrained ( "bashar-talafha/multi-dialect-bert-base-arabic" )

ตัวอย่างการใช้ pipeline :

 from transformers import pipeline

fill_mask = pipeline (
    "fill-mask" ,
    model = "bashar-talafha/multi-dialect-bert-base-arabic " ,
    tokenizer = "bashar-talafha/multi-dialect-bert-base-arabic "
)

fill_mask ( " سافر الرحالة من مطار [MASK] " )

 [{'sequence': '[CLS] سافر الرحالة من مطار الكويت [SEP]', 'score': 0.08296813815832138, 'token': 3226},
 {'sequence': '[CLS] سافر الرحالة من مطار دبي [SEP]', 'score': 0.05123933032155037, 'token': 4747},
 {'sequence': '[CLS] سافر الرحالة من مطار مسقط [SEP]', 'score': 0.046838656067848206, 'token': 13205},
 {'sequence': '[CLS] سافر الرحالة من مطار القاهرة [SEP]', 'score': 0.03234650194644928, 'token': 4003},
 {'sequence': '[CLS] سافر الرحالة من مطار الرياض [SEP]', 'score': 0.02606341242790222, 'token': 2200}]

พารามิเตอร์รุ่น

พารามิเตอร์	ค่า
สถาปัตยกรรม	bertformaskedlm
hidden_size	768
max_position_embeddings	512
num_attention_heads	12
num_hidden_layers	12
คำศัพท์	32000
hidden_size	768
จำนวนพารามิเตอร์ทั้งหมด	110m

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท โค้ดแหล่งที่มา AI
เวลาอัปเดต 2025-09-08
ขนาด 849.63KB
มาจาก Github

แอปที่เกี่ยวข้อง

multi roblox macos

2024-11-14
สภาพอากาศของซาอุดีอาระเบีย - ภาษาอาหรับ

2024-11-12
TikTok Multi Downloader

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Dragon Ball Project เวอร์ชั่นภาษาจีนหลายภาษา

2024-08-23
Family Guy: กลับสู่ Multi

2022-08-29

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ML stack

โค้ดแหล่งที่มา AI

1.0.0
awesome free chatgpt

โค้ดแหล่งที่มา AI

1.0.0
pywin_contextmenu

โค้ดแหล่งที่มา AI

Version update
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด