Multi dialect Arabic BERT Download - Multi dialect Arabic BERT Code Source Télécharger

Multi dialect Arabic BERT

Code Source AI

1.0.0

Télécharger

Multi-dialect-arabic-bert

Il s'agit d'un référentiel du modèle Bert arabe multi-dialect.

Par Mawdoo3-ai.

Référence d'arrière-plan: http://www.qfi.org/wp-content/uploads/2018/02/qfi_infographic_motherLanguage_Final.pdf

À propos de notre modèle multi-dialect-arabic-bert

Au lieu de former le modèle arabe Bert arabe multi-diale à partir de zéro, nous avons initialisé les poids du modèle à l'aide d'arabe-BERT et l'avons formé sur des tweets arabes de 10 m à partir des données non autorisées de la tâche partagée de l'identification du dialecte arabe nuancé (NADI).

Pour citer ce travail

 @misc{talafha2020multidialect,
    title={Multi-Dialect Arabic BERT for Country-Level Dialect Identification},
    author={Bashar Talafha and Mohammad Ali and Muhy Eddin Za'ter and Haitham Seelawi and Ibraheem Tuffaha and Mostafa Samir and Wael Farhan and Hussein T. Al-Natsheh},
    year={2020},
    eprint={2007.05612},
    archivePrefix={arXiv},
    primaryClass={cs.CL}
}

Usage

Les poids du modèle peuvent être chargés à l'aide de la bibliothèque transformers en serrant le plan.

 from transformers import AutoTokenizer , AutoModel

tokenizer = AutoTokenizer . from_pretrained ( "bashar-talafha/multi-dialect-bert-base-arabic" )
model = AutoModel . from_pretrained ( "bashar-talafha/multi-dialect-bert-base-arabic" )

Exemple à l'aide pipeline :

 from transformers import pipeline

fill_mask = pipeline (
    "fill-mask" ,
    model = "bashar-talafha/multi-dialect-bert-base-arabic " ,
    tokenizer = "bashar-talafha/multi-dialect-bert-base-arabic "
)

fill_mask ( " سافر الرحالة من مطار [MASK] " )

 [{'sequence': '[CLS] سافر الرحالة من مطار الكويت [SEP]', 'score': 0.08296813815832138, 'token': 3226},
 {'sequence': '[CLS] سافر الرحالة من مطار دبي [SEP]', 'score': 0.05123933032155037, 'token': 4747},
 {'sequence': '[CLS] سافر الرحالة من مطار مسقط [SEP]', 'score': 0.046838656067848206, 'token': 13205},
 {'sequence': '[CLS] سافر الرحالة من مطار القاهرة [SEP]', 'score': 0.03234650194644928, 'token': 4003},
 {'sequence': '[CLS] سافر الرحالة من مطار الرياض [SEP]', 'score': 0.02606341242790222, 'token': 2200}]

Paramètres du modèle

Paramètre	Valeur
architecture	Bertformaskedlm
Hidden_size	768
max_position_embeddings	512
num_attention_heads	12
num_hidden_layers	12
vocab_size	32000
Hidden_size	768
Nombre total de paramètres	110m

Développer

Informations supplémentaires

Version 1.0.0
Type Code Source AI
Date de mise à jour 2025-09-08
taille 849.63KB
Provenant de Github

Applications connexes

multi roblox macos

2024-11-14
Météo en Arabie Saoudite - Arabe

2024-11-12
TikTok Multi Downloader

2024-11-10
GitHub sgrebnov/cordova plugin background download

2024-11-05
Dragon Ball Project Multi version chinoise

2024-08-23
Family Guy : Retour au Multi

2022-08-29

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ML stack

Code Source AI

1.0.0
awesome free chatgpt

Code Source AI

1.0.0
pywin_contextmenu

Code Source AI

Version update
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout