attention is all you need pytorch - attention is all you need pytorch

attention is all you need pytorch

Outro código-fonte

1.0.0

Baixar

Atenção é tudo o que você precisa: uma implementação de pytorch

Esta é uma implementação de Pytorch do modelo de transformador em "Atenção é tudo o que você precisa" (Ashish Vaswani, Noam Orheador, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin, Arxiv, 2017).

Uma nova sequência à estrutura de sequência utiliza o mecanismo de auto-atimento , em vez de a operação de convolução ou estrutura recorrente, e atinge o desempenho de ponta na tarefa de tradução do WMT 2014 Inglês-Alemão . (2017/06/12)

A implementação oficial do tensorflow pode ser encontrada em: tensorflow/tensor2tensor.

Para saber mais sobre o mecanismo de auto-atendimento, você pode ler "uma sentença auto-atenta estruturada incorporando".

O projeto de suporte ao projeto e tradução com modelo treinado agora.

Observe que este projeto ainda é um trabalho em andamento.

As peças relacionadas ao BPE ainda não foram totalmente testadas.

Se houver alguma sugestão ou erro, fique à vontade para disparar um problema para me informar. :)

Uso

WMT'16 Tradução multimodal: De-en

Um exemplo de treinamento para a tarefa de tradução multimodal WMT'16 (http://www.statmt.org/wmt16/multimodal-task.html).

0) Faça o download do modelo de idioma spacy.

 # conda install -c conda-forge spacy 
python -m spacy download en
python -m spacy download de

1) Pré -processo os dados com Torchtext e Spacy.

python preprocess.py -lang_src de -lang_trg en -share_vocab -save_data m30k_deen_shr.pkl

2) Treine o modelo

python train.py -data_pkl m30k_deen_shr.pkl -log m30k_deen_shr -embs_share_weight -proj_share_weight -label_smoothing -output_dir output -b 256 -warmup 128000 -epoch 400

3) Teste o modelo

python translate.py -data_pkl m30k_deen_shr.pkl -model trained.chkpt -output prediction.txt

[(WIP)] WMT'17 Tradução multimodal: De-en W/ BPE

1) Faça o download e pré -processo dos dados com BPE:

Como as interfaces não são unificadas, você precisa alternar a chamada de função principal de main_wo_bpe para main .

python preprocess.py -raw_dir /tmp/raw_deen -data_dir ./bpe_deen -save_data bpe_vocab.pkl -codes codes.txt -prefix deen

2) Treine o modelo

python train.py -data_pkl ./bpe_deen/bpe_vocab.pkl -train_path ./bpe_deen/deen-train -val_path ./bpe_deen/deen-val -log deen_bpe -embs_share_weight -proj_share_weight -label_smoothing -output_dir output -b 256 -warmup 128000 -epoch 400

3) Teste o modelo (não pronto)

PENDÊNCIA:
- Carregar vocabulário.
- Realize a decodificação após a tradução.

Desempenho

Treinamento

Configurações de parâmetros:
- Tamanho do lote 256
- Aquecimento Etapa 4000
- Epoch 200
- lr_mul 0.5
- rótulo de suavização
- Não aplique BPE e vocabulário compartilhado
- Incorporação de destino / pré-Softmax Linear Camada Compartilhamento de peso.

Teste

em breve.

PENDÊNCIA

Avaliação no texto gerado.
Plotagem de peso de atenção.

Reconhecimento

As peças de codificação de pares de bytes são emprestadas do subglema-NMT.
A estrutura do projeto, alguns scripts e as etapas de pré-processamento do conjunto de dados são fortemente emprestadas do OpenNMT/OpenNMT-Py.
Obrigado pelas sugestões de @srush, @iamalbert, @zessay, @julesgm, @zijianzhao e @huanghoujing.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-04-16
tamanho 27.53KB
Vindo de Github

Aplicativos Relacionados

pytorch image models

2024-11-03
O amor está por toda parte

2023-10-24
Você vai caracol

2023-07-12
Necessidade de velocidade móvel

2023-07-11
Você deve

2022-08-05
Aí está você

2022-07-27

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos