QuBERT下载 - QuBERT源代码下载

QuBERT

Ai源码

QuBERT - BPE_guide - Normalized Data

下载

奎伯特

Calloberta是Quechua的基于罗伯塔的语言模型。我们的语言模型是通过Quechua Southern（Collao和Chanka）的文字预先提出的。

关于模型

模块	释放
卡尔伯塔	config.json，pytorch_model.bin
令牌	Merges.txt，vocab.json

该模型使用一个字节级的BPE令牌，并带有52000个子Palabras代币词汇。

可用性

一旦放出了上面的重量和令牌，就必须将其连接到单个文件夹中，在这种情况下， LlamaRoBERTa 。

 from transformers import pipeline

fill_mask = pipeline (
    "fill-mask" ,
    model = "./LlamaRoBERTa" ,
    tokenizer = "./LlamaRoBERTa"
)

该测试已完成，这是改进的阶段。

 fill_mask ( "allinllachu <mask> allinlla huk wasipita." )

 [{'score': 0.23992203176021576,
 'sequence': 'allinllachu nisqaqa allinlla huk wasipita.',
 'token': 334,
 'token_str': ' nisqaqa'},
{'score': 0.061005301773548126,
 'sequence': 'allinllachu, allinlla huk wasipita.',
 'token': 16,
 'token_str': ','},
 {'score': 0.028720015659928322,
 'sequence': "allinllachu' allinlla huk wasipita.",
 'token': 11,
 'token_str': "'"},
{'score': 0.012927944771945477,
'sequence': 'allinllachu kay allinlla huk wasipita.',
'token': 377,
'token_str': ' kay'},
{'score': 0.01230092253535986,
'sequence': 'allinllachu. allinlla huk wasipita.',
 'token': 18,
'token_str': '.'}]

展开

附加信息