attention is all you need pytorchダウンロードです - attention is all you need pytorchソースコードダウンロード

attention is all you need pytorch

その他のソースコード

1.0.0

ダウンロード

注意が必要なのは、Pytorchの実装です

これは、「注意が必要なのは、注意が必要です」（Ashish Vaswani、Noam Shazeer、Niki Parmar、Jakob Uszkoreit、Llion Jones、Aidan N. Gomez、Lukasz Kaiser、Illia Polosukhin、Arxiv、2017）におけるトランスモデルのPytorch実装です。

シーケンスフレームワークの新しいシーケンスは、畳み込み操作や再発構造ではなく、自己触媒メカニズムを利用し、 WMT 2014 English-to-German翻訳タスクで最先端のパフォーマンスを実現します。（2017/06/12）

公式のTensorFlowの実装は、Tensorflow/Tensor2Tensorにあります。

自己関節のメカニズムの詳細については、「構造化された自己attentive文の埋め込み」を読むことができます。

プロジェクトは、トレーニングモデルを使用したトレーニングと翻訳をサポートしています。

このプロジェクトはまだ進行中の作業であることに注意してください。

BPE関連部品はまだ完全にテストされていません。

提案やエラーがある場合は、お気軽に問題を解決してください。 :)

使用法

WMT'16マルチモーダル翻訳：de-en

WMT'16マルチモーダル翻訳タスク（http://www.statmt.org/wmt16/multimodal-task.html）のトレーニングの例。

0）スペイシー言語モデルをダウンロードします。

 # conda install -c conda-forge spacy 
python -m spacy download en
python -m spacy download de

1）TorchTextとSpacyでデータを前処理します。

python preprocess.py -lang_src de -lang_trg en -share_vocab -save_data m30k_deen_shr.pkl

2）モデルをトレーニングします

python train.py -data_pkl m30k_deen_shr.pkl -log m30k_deen_shr -embs_share_weight -proj_share_weight -label_smoothing -output_dir output -b 256 -warmup 128000 -epoch 400

3）モデルをテストします

python translate.py -data_pkl m30k_deen_shr.pkl -model trained.chkpt -output prediction.txt

[（wip）] wmt'17マルチモーダル翻訳：de-en w/ bpe

1）BPEでデータをダウンロードして前処理します。

インターフェイスは統合されていないため、 main_wo_bpeからMain_WO_BPEにメイン関数呼び出しをmainに切り替える必要があります。

python preprocess.py -raw_dir /tmp/raw_deen -data_dir ./bpe_deen -save_data bpe_vocab.pkl -codes codes.txt -prefix deen

2）モデルをトレーニングします

python train.py -data_pkl ./bpe_deen/bpe_vocab.pkl -train_path ./bpe_deen/deen-train -val_path ./bpe_deen/deen-val -log deen_bpe -embs_share_weight -proj_share_weight -label_smoothing -output_dir output -b 256 -warmup 128000 -epoch 400

3）モデルをテストする（準備ができていない）

TODO：
- ボキャブラリーをロードします。
- 翻訳後にデコードを実行します。

パフォーマンス

トレーニング

パラメーター設定：
- バッチサイズ256
- ウォームアップステップ4000
- エポック200
- LR_MUL 0.5
- ラベルのスムージング
- BPEと共有語彙を適用しないでください
- ターゲット埋め込み /ソフト速度前層のリニアレイヤー重量共有。

テスト

近日公開。

トト

生成されたテキストの評価。
注意ウェイトプロット。

了承

バイトペアエンコーディングパーツは、subword-nmtから借りられます。
プロジェクト構造、いくつかのスクリプト、およびデータセットの前処理手順は、OpenNMT/OpenNMT-Pyから大幅に借用されています。
@srush、@iamalbert、@zessay、@julesgm、@zijianzhao、@huanghoujingからの提案をありがとう。

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-04-16
サイズ 27.53KB
から Github

attention is all you need pytorch

注意が必要なのは、Pytorchの実装です

使用法

WMT'16マルチモーダル翻訳：de-en

0）スペイシー言語モデルをダウンロードします。

1）TorchTextとSpacyでデータを前処理します。

2）モデルをトレーニングします

3）モデルをテストします

[（wip）] wmt'17マルチモーダル翻訳：de-en w/ bpe

1）BPEでデータをダウンロードして前処理します。

2）モデルをトレーニングします

3）モデルをテストする（準備ができていない）

パフォーマンス

トレーニング

テスト

トト

了承

pytorch image models

ラブ・イズ・オール・アラウンド

カタツムリしますか

ニード・フォー・スピードモバイル

絶対です

そこにいる

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express