tf seq2seq Download - tf seq2seq Código fonte download

tf seq2seq

Outro código-fonte

1.0.0

Baixar

Tf-seq2seq

Sequência à sequência (SEQ2SEQ) Aprendizagem usando o tensorflow.

Os principais blocos de construção são arquiteturas de decodificadores de codificadores RNN e mecanismo de atenção.

O pacote foi amplamente implementado usando os módulos mais recentes (1.2) tf.contrib.seq2seq

Authortwrapper
Decodificador
BasicDecoder
BeamSearchDecoder

O pacote suporta

GRU/LSTM de várias camadas
Conexão residual
Cair fora
Atenção e input_feeding
Decodificação do BeamSearch
Escreva a lista N-Best

Dependências

Numpy> = 1.11.1
Tensorflow> = 1.2

História

5 de junho de 2017: Atualização principal
6 de junho de 2017: suporta a decodificação do Batch Beamsearch
11 de junho de 2017: Treinamento / Decodificação Separado
22 de junho de 2017: suporta tf.1.2 (contrib.rnn -> python.ops.rnn_cell)

Instruções de uso

Preparação de dados

Para pré -processar dados paralelos brutos de sample_data.src e sample_data.trg , basta executar

 cd data /
. / preprocess . sh src trg sample_data $ { max_seq_len }

A execução do código acima executa as etapas de pré -processamento amplamente utilizadas para a tradução da máquina (MT).

Normalização da pontuação
Tokenizing
Bytepair Encoding (# Merge = 30000) (Sennrich et al., 2016)
Sequências de limpeza de comprimento acima de $ {max_seq_len}
Embaralhando
Dicionários de construção

Treinamento

Para treinar um modelo SEQ2SEQ,

$ python train . py   -- cell_type 'lstm'  
                    -- attention_type 'luong' 
                    -- hidden_units 1024 
                    -- depth 2 
                    -- embedding_size 500 
                    -- num_encoder_symbols 30000 
                    -- num_decoder_symbols 30000 ...

Decodificação

Para executar o modelo treinado para decodificar,

$ python decode . py  -- beam_width 5 
                    -- decode_batch_size 30 
                    -- model_path $PATH_TO_A_MODEL_CHECKPOINT ( e . g . model / translate . ckpt - 100 ) 
                    -- max_decode_step 300 
                    -- write_n_best False
                    -- decode_input $PATH_TO_DECODE_INPUT
                    -- decode_output $PATH_TO_DECODE_OUTPUT

If --beam_width=1 , a decodificação gananciosa é realizada a cada passo do tempo.

Argumentos

Params de dados

--source_vocabulary : caminho para o vocabulário de origem
--target_vocabulary : caminho para o vocabulário alvo
--source_train_data : caminho para dados de treinamento de origem
--target_train_data : caminho para direcionar dados de treinamento
--source_valid_data : caminho para dados de validação de origem
--target_valid_data : caminho para direcionar dados de validação

Params de rede

--cell_type : célula RNN para usar para codificador e decodificador (padrão: LSTM)
--attention_type : mecanismo de atenção (Bahdanau, Luong), (Padrão: Bahdanau)
--depth : Número de unidades ocultas para cada camada no modelo (Padrão: 2)
--embedding_size : Incorporação de dimensões das entradas do codificador e decodificador (Padrão: 500)
--num_encoder_symbols : Tamanho do vocabulário da fonte a ser usado (padrão: 30000)
--num_decoder_symbols : Tamanho do vocabulário de destino a ser usado (padrão: 30000)
--use_residual : use a conexão residual entre camadas (padrão: true)
--attn_input_feeding : Use o método de alimentação de entrada no decodificador atencional (Luong et al., 2015) (padrão: true)
--use_dropout : use o abandono na saída da célula RNN (padrão: true)
--dropout_rate : Probabilidade de abandono para saídas de células (0,0: sem abandono) (Padrão: 0.3)

Parâmetros de treinamento

--learning_rate : número de unidades ocultas para cada camada no modelo (padrão: 0,0002)
--max_gradient_norm : gradientes de clipe para esta norma (padrão 1.0)
--batch_size : tamanho do lote
--max_epochs : épocas máximas de treinamento
--max_load_batches : Número máximo de lotes para preencher ao mesmo tempo.
--max_seq_length : comprimento máximo de sequência
--display_freq : exibir status de treinamento toda iteração
--save_freq : salvar o modelo de verificação do modelo a cada iteração
--valid_freq : Avalie o modelo toda essa iteração: válida_data necessária
--optimizer : Optimizer for Training: (Adadelta, Adam, RMSProp) (Padrão: Adam)
--model_dir : caminho para salvar os pontos de verificação do modelo
--model_name : Nome do arquivo usado para pontos de verificação do modelo
--shuffle_each_epoch : Shuffle Training DataSet para cada época (padrão: true)
--sort_by_length : classifique os minibatches pré-buscados por seus comprimentos de sequência alvo (padrão: true)

Decodificando params

--beam_width : largura do feixe usada no BeamSearch (padrão: 1)
--decode_batch_size : Tamanho do lote usado na decodificação
--max_decode_step : limite máximo de etapa de tempo na decodificação (padrão: 500)
--write_n_best : write beamsearch n-best list (n = feam_width) (padrão: false)
--decode_input : Caminho do arquivo de entrada para decodificar
--decode_output : Saída do caminho do arquivo da saída de decodificação

Params de tempo de execução

--allow_soft_placement : permitir a colocação suave do dispositivo
--log_device_placement : colocação de logs de operações em dispositivos

Agradecimentos

A implementação é baseada nos seguintes projetos:

Nematus: Theano Implementação da tradução da máquina neural. Principal referência deste projeto
Subpater-nmt: scripts de subbim incluídos para pré-processamento de dados de entrada
Moisés: Incluído scripts de pré -processamento para pré -processar dados de entrada
tf.seq2seq_legacy legado tensorflow seq2seq tutorial
TF_TUTORIAL_PLUS: Bons tutoriais para tf.contrib.seq2seq API

Para quaisquer comentários e feedbacks, envie -me um email para [email protected] ou abra um problema aqui.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-04-16
tamanho 69.36KB
Vindo de Github

Aplicativos Relacionados

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Versão Android do TF Fire Frenzy

2023-03-15
Assinatura Apple ios Assinatura MDM Assinatura TF Código-fonte da assinatura corporativa da Apple

2022-09-29
Assinatura Apple ios Assinatura MDM Assinatura TF, código-fonte da assinatura corporativa da Apple

2022-09-23

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos