QuBERT Download - Загрузка исходного кода QuBERT

QuBERT

AI Исходный код

QuBERT - BPE_guide - Normalized Data

Скачать

Qubert

Calloberta -это языковая модель на основе Роберты для Quechua. Наша языковая модель была предоставлена текстом от Quechua Southern (Collao и Chanka).

О модели

Модуль	Увольнять
Калберта	config.json, pytorch_model.bin
Токенизатор	Merges.txt, Vocab.json

В модели используется токенизатор BPE на уровне байта со словарным запасом токенов 52000.

Удобство использования

После того, как веса и токенизатор в приведенном выше разделе разряжены, необходимо прикрепить его в одну папку, в данном случае это было LlamaRoBERTa .

 from transformers import pipeline

fill_mask = pipeline (
    "fill-mask" ,
    model = "./LlamaRoBERTa" ,
    tokenizer = "./LlamaRoBERTa"
)

Тест выполнен, который находится на этапах улучшений.

 fill_mask ( "allinllachu <mask> allinlla huk wasipita." )

 [{'score': 0.23992203176021576,
 'sequence': 'allinllachu nisqaqa allinlla huk wasipita.',
 'token': 334,
 'token_str': ' nisqaqa'},
{'score': 0.061005301773548126,
 'sequence': 'allinllachu, allinlla huk wasipita.',
 'token': 16,
 'token_str': ','},
 {'score': 0.028720015659928322,
 'sequence': "allinllachu' allinlla huk wasipita.",
 'token': 11,
 'token_str': "'"},
{'score': 0.012927944771945477,
'sequence': 'allinllachu kay allinlla huk wasipita.',
'token': 377,
'token_str': ' kay'},
{'score': 0.01230092253535986,
'sequence': 'allinllachu. allinlla huk wasipita.',
 'token': 18,
'token_str': '.'}]

Расширять

Дополнительная информация