Dies ist eine Pytorch -Implementierung des Transformatormodells in "Aufmerksamkeit ist alles, was Sie brauchen" (Ashish Vaswani, Noam SHAZEER, NIKI Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser, Illia Polosukhin, Arxiv, 2017).
Eine neuartige Sequenz-zu-Sequenz-Framework verwendet den Selbstbekämpfungsmechanismus anstelle des Faltungsbetriebs oder der wiederkehrenden Struktur und erreicht die hochmoderne Leistung bei der Übersetzungsaufgabe von WMT 2014 . (2017/06/12)
Die offizielle Tensorflow -Implementierung finden Sie in: TensorFlow/Tensor2tensor.
Um mehr über den Selbstbekämpfungsmechanismus zu erfahren, konnten Sie "eine strukturierte Selbstanatterungsstrafe" lesen.
Das Projektunterstützungstraining und die Übersetzung mit geschultem Modell jetzt.
Beachten Sie, dass dieses Projekt noch in Arbeit ist.
BPE -verwandte Teile sind noch nicht vollständig getestet.
Wenn es einen Vorschlag oder einen Fehler gibt, können Sie ein Problem damit abfeuern, um mich wissen zu lassen. :)
Ein Beispiel für das Training für die multimodale Übersetzungsaufgabe von WMT'16 (http://www.statmt.org/wmt16/multimodal-task.html).
# conda install -c conda-forge spacy
python -m spacy download en
python -m spacy download depython preprocess.py -lang_src de -lang_trg en -share_vocab -save_data m30k_deen_shr.pklpython train.py -data_pkl m30k_deen_shr.pkl -log m30k_deen_shr -embs_share_weight -proj_share_weight -label_smoothing -output_dir output -b 256 -warmup 128000 -epoch 400python translate.py -data_pkl m30k_deen_shr.pkl -model trained.chkpt -output prediction.txtDa die Schnittstellen nicht einheitlich sind, müssen Sie den Hauptfunktionsaufruf von
main_wo_bpeaufmainwechseln.
python preprocess.py -raw_dir /tmp/raw_deen -data_dir ./bpe_deen -save_data bpe_vocab.pkl -codes codes.txt -prefix deenpython train.py -data_pkl ./bpe_deen/bpe_vocab.pkl -train_path ./bpe_deen/deen-train -val_path ./bpe_deen/deen-val -log deen_bpe -embs_share_weight -proj_share_weight -label_smoothing -output_dir output -b 256 -warmup 128000 -epoch 400