tf seq2seqダウンロードtf seq2seqソースコードのダウンロード

tf seq2seq

その他のソースコード

1.0.0

ダウンロード

TF-seq2seq

Tensorflowを使用したシーケンス（Seq2Seq）の学習へのシーケンス。

コアビルディングブロックは、RNNエンコーダデコーダーアーキテクチャと注意メカニズムです。

このパッケージは、最新（1.2）tf.contrib.seq2seqモジュールを使用して主に実装されていました

AttentionWrapper
デコーダ
BasicDeCoder
BeamSearchDecoder

パッケージはサポートします

多層GRU/LSTM
残留接続
ドロップアウト
注意とinput_feeding
BeamSearch Decoding
nベストリストを書きます

依存関係

numpy> = 1.11.1
Tensorflow> = 1.2

歴史

2017年6月5日：メジャーアップデート
2017年6月6日：Batch BeamSearch Decodingをサポートしています
2017年6月11日：トレーニング /デコードを分離しました
2017年6月22日：TF.1.2をサポートする（contrib.rnn-> python.ops.rnn_cell）

使用手順

データの準備

sample_data.srcとsample_data.trgの生の並列データを事前に処理するには、単に実行する

 cd data /
. / preprocess . sh src trg sample_data $ { max_seq_len }

上記のコードを実行すると、機械翻訳（MT）に広く使用されている前処理手順が実行されます。

句読点を正常化します
トークン化
Bytepairエンコード（＃Merge = 30000）（Sennrich et al。、2016）
$ {max_seq_len}を超える長さのクリーニングシーケンス
シャッフリング
建物の辞書

トレーニング

seq2seqモデルをトレーニングするには、

$ python train . py   -- cell_type 'lstm'  
                    -- attention_type 'luong' 
                    -- hidden_units 1024 
                    -- depth 2 
                    -- embedding_size 500 
                    -- num_encoder_symbols 30000 
                    -- num_decoder_symbols 30000 ...

デコード

デコードのために訓練されたモデルを実行するには、

$ python decode . py  -- beam_width 5 
                    -- decode_batch_size 30 
                    -- model_path $PATH_TO_A_MODEL_CHECKPOINT ( e . g . model / translate . ckpt - 100 ) 
                    -- max_decode_step 300 
                    -- write_n_best False
                    -- decode_input $PATH_TO_DECODE_INPUT
                    -- decode_output $PATH_TO_DECODE_OUTPUT

--beam_width=1の場合、各タイムステップで貪欲なデコードが実行されます。

議論

データパラメーション

--source_vocabulary ：ソース語彙へのパス
--target_vocabulary ：ターゲット語彙へのパス
--source_train_data ：ソーストレーニングデータへのパス
--target_train_data ：ターゲットトレーニングデータへのパス
--source_valid_data ：ソース検証データへのパス
--target_valid_data ：ターゲット検証データへのパス

ネットワークパラメーション

--cell_type ：エンコーダーとデコーダーに使用するRNNセル（デフォルト：LSTM）
--attention_type ：注意メカニズム（Bahdanau、luong）、（デフォルト：Bahdanau）
--depth ：モデル内の各レイヤーの非表示ユニットの数（デフォルト：2）
--embedding_size ：エンコーダーとデコーダーの入力の寸法の埋め込み（デフォルト：500）
--num_encoder_symbols ：使用するソース語彙サイズ（デフォルト：30000）
--num_decoder_symbols ：使用するターゲットの語彙サイズ（デフォルト：30000）
--use_residual ：レイヤー間の残留接続を使用します（デフォルト：true）
--attn_input_feeding ：注意デコーダーで入力給餌方法を使用します（Luong et al。、2015）（デフォルト：True）
--use_dropout ：RNNセル出力でドロップアウトを使用します（デフォルト：true）
--dropout_rate ：セル出力のドロップアウト確率（0.0：ドロップアウトなし）（デフォルト：0.3）

トレーニングパラメーション

--learning_rate ：モデル内の各レイヤーの非表示ユニットの数（デフォルト：0.0002）
--max_gradient_norm ：このノルムへのクリップグラデーション（デフォルト1.0）
--batch_size ：バッチサイズ
--max_epochs ：最大トレーニングエポック
--max_load_batches ：一度にプリフェッチするバッチの最大数。
--max_seq_length ：最大シーケンス長
--display_freq ：この反復ごとにトレーニングステータスを表示します
--save_freq ：この反復ごとにモデルチェックポイントを保存します
--valid_freq ：モデルを評価するすべての繰り返し：valid_dataが必要
--optimizer ：トレーニング用オプティマイザー：（ Adadelta、Adam、RMSProp）（デフォルト：Adam）
--model_dir ：モデルチェックポイントを保存するパス
--model_name ：モデルチェックポイントに使用されるファイル名
--shuffle_each_epoch ：各エポックのシャッフルトレーニングデータセット（デフォルト：true）
--sort_by_length ：ターゲットシーケンスの長さで事前にフェッチしたミニバッチをソートします（デフォルト：true）

パラメーションのデコード

--beam_width ：beamsearchで使用されるビーム幅（デフォルト：1）
--decode_batch_size ：デコードで使用されるバッチサイズ
--max_decode_step ：デコードの最大時間ステップ制限（デフォルト：500）
--write_n_best ：beamsearch n-bestリストを書き込む（n = beam_width）（デフォルト：false）
--decode_input ：decodeにファイルパスを入力します
--decode_output ：出力ファイルパスのデコード出力のパス

ランタイムパラメーション

--allow_soft_placement ：デバイスのソフト配置を許可します
--log_device_placement ：デバイス上のOPSのログ配置

謝辞

実装は、次のプロジェクトに基づいています。

Nematus：神経機械翻訳のTheano実装。このプロジェクトの主要な参照
Subword-NMT：入力データを事前に処理するためのサブワードユニットスクリプトが含まれています
モーゼ：入力前データを前処理するための前処理スクリプトが含まれています
TF.SEQ2SEQ_LEGACY LEGACY TENSORFLOW SEQ2SEQチュートリアル
tf_tutorial_plus：tf.contrib.seq2seq apiの素晴らしいチュートリアル

コメントやフィードバックについては、[email protected]までメールでお問い合わせいただくか、ここで問題を開いてください。

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-04-16
サイズ 69.36KB
から Github

tf seq2seq

TF-seq2seq

Tensorflowを使用したシーケンス（Seq2Seq）の学習へのシーケンス。

依存関係

歴史

使用手順

データの準備

トレーニング

デコード

議論

謝辞

GitHub sgrebnov/cordova plugin background download

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

TF ファイアフレンジー Android 版

Apple ios 署名 MDM 署名 TF 署名 Apple エンタープライズ署名ソースコード

Apple iOS署名 MDM署名 TF署名署名、Appleエンタープライズ署名ソースコード

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express