tf seq2seq Téléchargement - tf seq2seq Téléchargement du code source

tf seq2seq

Autre code source

1.0.0

Télécharger

Tf-seq2seq

Séquence à la séquence (SEQ2SEQ) Apprentissage à l'aide de TensorFlow.

Les principaux blocs de construction sont des architectures de coder RNN et un mécanisme d'attention.

Le package a été largement mis en œuvre en utilisant les dernières modules TF.Contrib.Seq2Seq

Tituteur de l'attention
Décodeur
Coder de base
BeamSearchDeccoder

Le package prend en charge

Multicouches GRU / LSTM
Connexion résiduelle
Abandonner
Attention et entrée_filation
Décodage de recherche de faisceau
Écrire la noix de liste

Dépendances

Numpy> = 1.11.1
TensorFlow> = 1.2

Histoire

5 juin 2017: mise à jour majeure
6 juin 2017: prend en charge le décodage de recherche de faisceau par lots
11 juin 2017: Formation / décodage séparé
22 juin 2017: prend en charge TF.1.2 (contrib.rnn -> python.ops.rnn_cell)

Instructions d'utilisation

Préparation des données

Pour prétraiter les données parallèles brutes de sample_data.src et sample_data.trg , exécutez simplement

 cd data /
. / preprocess . sh src trg sample_data $ { max_seq_len }

L'exécution du code ci-dessus effectue des étapes de prétraitement largement utilisées pour la traduction automatique (MT).

Normaliser la ponctuation
Tokenisage
Encodage Bytepair (# Merge = 30000) (Sennrich et al., 2016)
Séquences de nettoyage de longueur sur $ {max_seq_len}
Mépris
Dictionnaires de construction

Entraînement

Pour entraîner un modèle SEQ2SEQ,

$ python train . py   -- cell_type 'lstm'  
                    -- attention_type 'luong' 
                    -- hidden_units 1024 
                    -- depth 2 
                    -- embedding_size 500 
                    -- num_encoder_symbols 30000 
                    -- num_decoder_symbols 30000 ...

Décodage

Pour gérer le modèle formé pour le décodage,

$ python decode . py  -- beam_width 5 
                    -- decode_batch_size 30 
                    -- model_path $PATH_TO_A_MODEL_CHECKPOINT ( e . g . model / translate . ckpt - 100 ) 
                    -- max_decode_step 300 
                    -- write_n_best False
                    -- decode_input $PATH_TO_DECODE_INPUT
                    -- decode_output $PATH_TO_DECODE_OUTPUT

Si --beam_width=1 , le décodage gourmand est effectué à chaque pas de temps.

Arguments

Paramètres de données

--source_vocabulary : chemin vers le vocabulaire source
--target_vocabulary : chemin vers le vocabulaire cibler
--source_train_data : chemin vers les données de formation source
--target_train_data : Chemin vers les données de formation cibler
--source_valid_data : Path vers les données de validation de la source
--target_valid_data : chemin vers les données de validation cibler

Paramètres du réseau

--cell_type : cellule RNN à utiliser pour l'encodeur et le décodeur (par défaut: LSTM)
--attention_type : Mécanisme d'attention (Bahdanau, Luong), (par défaut: Bahdanau)
--depth : nombre d'unités cachées pour chaque couche du modèle (par défaut: 2)
--embedding_size : Incorporer les dimensions des entrées d'encodeur et de décodeur (par défaut: 500)
--num_encoder_symbols : taille du vocabulaire source à utiliser (par défaut: 30000)
--num_decoder_symbols : taille de vocabulaire cible à utiliser (par défaut: 30000)
--use_residual : Utilisez la connexion résiduelle entre les couches (par défaut: true)
--attn_input_feeding : utilisez la méthode d'alimentation d'entrée dans le décodeur attentionnel (Luong et al., 2015) (par défaut: true)
--use_dropout : Utilisez Dropout dans la sortie de la cellule RNN (par défaut: true)
--dropout_rate : probabilité de dépôt pour les sorties de cellules (0,0: pas de dépôt) (par défaut: 0,3)

Paramètres de formation

--learning_rate : nombre d'unités cachées pour chaque couche du modèle (par défaut: 0,0002)
--max_gradient_norm : Clip gradients à cette norme (par défaut 1.0)
- --batch_size : Taille du lot
--max_epochs : époques de formation maximale
--max_load_batches : nombre maximum de lots à préflure en même temps.
--max_seq_length : longueur de séquence maximale
--display_freq : afficher le statut de formation chaque itération
--save_freq : Enregistrer le point de contrôle du modèle chaque itération
--valid_freq : évaluer le modèle chaque itération: valid_data nécessaire
--optimizer : Optimiseur pour la formation: (Adadelta, Adam, RMSProp) (par défaut: Adam)
--model_dir : chemin pour enregistrer les points de contrôle du modèle
--model_name : nom de fichier utilisé pour les points de contrôle du modèle
--shuffle_each_epoch : ensemble de données d'entraînement pour chaque époque (par défaut: true)
--sort_by_length : trier les minibatchs pré-chargés par leurs longueurs de séquence cible (par défaut: true)

Paramètres de décodage

--beam_width : Largeur du faisceau utilisé dans BeamSearch (par défaut: 1)
--decode_batch_size : taille du lot utilisé dans le décodage
--max_decode_step : limite de pas de temps maximale en décodage (par défaut: 500)
--write_n_best : écriture de la liste de recherche N-Best (n = Beam_width) (par défaut: false)
--decode_input : chemin d'entrée de fichier pour décoder
--decode_output : chemin de fichier de sortie de la sortie du décodage

Paramètres d'exécution

--allow_soft_placement : permettez le placement souple de l'appareil
--log_device_placement : placement du journal des opérations sur les appareils

Remerciements

La mise en œuvre est basée sur les projets suivants:

Nematus: Implémentation Theano de la traduction de la machine neuronale. Référence majeure de ce projet
sous-mot-nmt: scripts sous-mot-unité inclus pour prétraiter les données d'entrée
Moïse: Scripts de prétraitement inclus pour prétraiter les données d'entrée
tf.seq2seq_legacy héritage Tensorflow SEQ2SEQ Tutoriel
tf_tutorial_plus: beaux tutoriels pour l'API tf.contrib.seq2seq

Pour tout commentaire et commentaires, veuillez m'envoyer un e-mail à [email protected] ou ouvrir un problème ici.

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-04-16
taille 69.36KB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Version Android de TF Fire Frenzy

2023-03-15
Signature Apple iOS Signature MDM Signature TF Signature d'entreprise Apple Code source

2022-09-29
Signature Apple iOS Signature MDM Signature TF, code source de signature d'entreprise Apple

2022-09-23

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout