xlnet Pytorch Download - xlnet Pytorch Código Fonte Download

xlnet Pytorch

Outro código-fonte

1.0.0

Baixar

XLNET-Pytorch Arxiv: 1906.08237

Implementação simples do XLNET com Pytorch Wrapper!

Você pode ver como a arquitetura XLNET funciona no pré-treinamento com tamanho pequeno em lote (= 1).

Para uso

$ git clone https://github.com/graykode/xlnet-Pytorch && cd xlnet-Pytorch

# To use Sentence Piece Tokenizer(pretrained-BERT Tokenizer)
$ pip install pytorch_pretrained_bert

$ python main.py --data ./data.txt --tokenizer bert-base-uncased 
   --seq_len 512 --reuse_len 256 --perm_size 256 
   --bi_data True --mask_alpha 6 --mask_beta 1 
   --num_predict 85 --mem_len 384 --num_epoch 100

Além disso, você pode executar o código no Google Colab facilmente.

Hiperparâmetros para pré -treinamento em papel.

#### Opção

—data (String): .txt arquivo para treinar. Não importa texto multilina. Além disso, um arquivo será um tensor de lote. Padrão: data.txt
—tokenizer (String): Acabei de usar o Tokenizer do HuggingFace/Pytorch-Preserd-Bert como tokenizer de subglema (vou editá-lo para a peça de frase em breve). Você pode escolher em bert-base-uncased , bert-large-uncased bert-base-cased , bert-large-cased . PADRÃO: bert-base-uncased
—seq_len (número inteiro): comprimento da sequência. Padrão: 512
—reuse_len (interger): número de token que pode ser reutilizado como memória. Pode ser metade do seq_len . Padrão: 256
—perm_size (interger): a duração da permutação mais longa. Pode ser definido para ser reuse_len. Padrão: 256
--bi_data (booleano): se deve criar dados bidirecionais. Se bi_data for True , biz(batch size) deve ser o número par. Padrão: False
—mask_alpha (interger): quantos tokens para formar um grupo. Defalut: 6
—mask_beta (Inteiro): Quantos tokens para mascarar dentro de cada grupo. Padrão: 1
—num_predict (interger): NUM de tokens a serem previstos. No papel, significa previsão parcial. Padrão: 85
—mem_len (Interger): Número de etapas para armazenar em cache na arquitetura Transformer-XL. Padrão: 384
—num_epoch (interger): número de época. Padrão: 100

O que é xlnet?

O XLNET é um novo método de aprendizado de representação de idiomas não supervisionado com base em um novo objetivo de modelagem de linguagem de permutação generalizada. Além disso, o XLNET emprega o transformador-xl como modelo de backbone, exibindo excelente desempenho para tarefas de idiomas envolvendo um longo contexto.

XLNET: pré -treinamento auto -regressivo generalizado para compreensão da linguagem
XLNet Github do autor do autor

Modelo	Mnli	Qnli	Qqp	Rte	SST-2	Mrpc	Cola	STS-B
Bert	86.6	92.3	91.3	70.4	93.2	88.0	60.6	90.0
Xlnet	89.8	93.9	91.8	83.8	95.6	89.2	63.6	91.8

Palavra -chave no xlnet

Como o XLNET se beneficiou dos modelos de regressão automática e de codificação automática?
- Modelo de regressão automática
- Modelo de codificação automática
Modelagem de linguagem de permutação com previsão parcial
- Modelagem de linguagem de permutação
- Previsão parcial
ATAÇÃO DE TODOS OS ESTRAMENTOS COM REPRESENTAÇÃO ACREDADE
- ATAÇÃO DE TODOS-STRAM
- Representação com reconhecimento de destino

Autor

Como o repositório original está sujeito à licença Apache2.0 , ele está sujeito à mesma licença.
Tae Hwan Jung (Jeff Jung) @graykode, Kyung Hee Univ CE (graduação).
Autor e -mail: [email protected]

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-04-16
tamanho 544.59KB
Vindo de Github

Aplicativos Relacionados

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
pytorch image models

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos