Download de torchKbert - torchKbert Código Fonte Download

torchKbert

Código-Fonte de IA

1.0.0

Baixar

Torchkbert

Nossa versão personalizada de Bert para Pytorch

ilustrar

Esta é uma biblioteca de modelos que eu personalizei e modificada parcialmente com base na biblioteca pytorch_pretringred_bert da Meelfy.

A intenção original deste projeto é satisfazer a conveniência de experimentos pessoais, para que não seja atualizado com frequência.

Função

A funcionalidade na biblioteca de modelos originais pytorch_pretringen_bert ainda é suportada;
Suporta codificação de posição de decomposição hierárquica.
Suporta Wobert com base na granularidade do Word. Pesos pytorch (o modelo Wobert Plus é fornecido aqui):
- Chinês_wobert_plus.zip (Código de Extração: FG6J)

usar

Instalar:
```
pip install torchKbert
```
Para exemplos de uso típico, consulte o diretório oficial de exemplos.
Se você deseja usar a codificação da posição de decomposição hierárquica para que o BERT possa processar um texto longo, basta passar no parâmetro is_hierarchical=True no model . Exemplos são os seguintes:
```
 model = BertModel(config)
encoder_outputs, _ = model(input_ids, token_ids, input_mask, is_hierarchical=True)
```
Se você deseja usar Wobert Chinês com base na granularidade do Word, basta passar em novos parâmetros ao criar o objeto BertTokenizer :
```
 from torchKbert.tokenization import BertTokenizer

tokenizer = BertTokenizer(
    vocab_file=vocab_path, 
    pre_tokenizer=lambda s: jieba.cut(s, HMM=False))
```
Quando não foi passado, o padrão é None . Ao participar de palavras, o padrão deve ser usado como palavras. Se você deseja restaurar o uso de unidades de palavras, basta passar no novo parâmetro pre_tokenize=False quando tokenize :
```
 tokenzier.tokenize(text, pre_tokenize=False)
```

fundo

Já escrevi pytorch_pretringen_bert em meelfy antes, e é muito conveniente chamar modelos pré-tenhados ou executar o ajuste fino. Mais tarde, devido a necessidades pessoais, eu queria reescrever uma versão que suporta a codificação de posição hierárquica da decomposição.

O Bert4keras de Sushen implementou essa função. Mas como estou acostumado a usar pytorch, não uso Keras há muito tempo, então pretendo reescrever um sozinho.

renovar

2021.03.07 : Adicione a codificação de posição de decomposição hierárquica.
2021.05.27 : Adicione Wobert chinês com base na granularidade do Word.
2022.03.27 : Consulte Pytorch_transformers para refatorar a implementação do código BertReTrenedModel.

consulte

Graças à implementação de Pytorch_Pretrened_bert pela Meelfy, essa implementação é inteiramente baseada no código -fonte de pytorch_pretriled_bert.
Agradeço a Su Shen por sua percepção e compartilhamento altruísta: a codificação hierárquica de posição da decomposição permite que Bert processe texto ultra-longo.
WOBERT: Modelo Chinês Bert baseado em palavras - Zhuiyiai.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-09-08
tamanho 85.53KB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos