attention is all you need pytorch下载 - attention is all you need pytorch源代码下载

attention is all you need pytorch

其他源码

1.0.0

下载

您只需要注意：Pytorch实施

这是“您需要的注意力”中变压器模型的Pytorch实现（Ashish Vaswani，Noam Shazeer，Niki Parmar，Jakob Uszkoreit，Llion Jones，Llion Jones，Aidan N. Gomez，Lukasz Kaiser，Lukasz Kaiser，Illia Polosukhin，Arxiv，Arxiv，2017年）。

序列框架的新序列利用自我发项机制，而不是卷积操作或经常性结构，并实现WMT 2014英语对德语翻译任务的最新性能。（2017/06/12）

官方的TensorFlow实现可在以下方面找到：TensorFlow/Tensor2Tensor。

要了解有关自我发挥机制的更多信息，您可以阅读“嵌入结构化的自我指导句子”。

现在，通过训练有素的模型支持培训和翻译。

请注意，该项目仍在进行中。

与BPE相关的零件尚未完全测试。

如果有任何建议或错误，请随时解雇一个问题，让我知道。 :)

用法

WMT'16多模式翻译：DE-EN

WMT'16多模式翻译任务的培训示例（http://www.statmt.org/wmt16/multimodal-task.html）。

0）下载Spacy语言模型。

 # conda install -c conda-forge spacy 
python -m spacy download en
python -m spacy download de

1）用火炬和spacy进行预处理数据。

python preprocess.py -lang_src de -lang_trg en -share_vocab -save_data m30k_deen_shr.pkl

2）训练模型

python train.py -data_pkl m30k_deen_shr.pkl -log m30k_deen_shr -embs_share_weight -proj_share_weight -label_smoothing -output_dir output -b 256 -warmup 128000 -epoch 400

3）测试模型

python translate.py -data_pkl m30k_deen_shr.pkl -model trained.chkpt -output prediction.txt

[（WIP）] WMT'17多模式翻译：de-en w/ bpe

1）使用BPE下载并预处理数据：

由于接口不是统一的，因此您需要将主函数调用从main_wo_bpe切换到main 。

python preprocess.py -raw_dir /tmp/raw_deen -data_dir ./bpe_deen -save_data bpe_vocab.pkl -codes codes.txt -prefix deen

2）训练模型

python train.py -data_pkl ./bpe_deen/bpe_vocab.pkl -train_path ./bpe_deen/deen-train -val_path ./bpe_deen/deen-val -log deen_bpe -embs_share_weight -proj_share_weight -label_smoothing -output_dir output -b 256 -warmup 128000 -epoch 400

3）测试模型（尚未准备就绪）

托多：
- 负载词汇。
- 翻译后执行解码。

表现

训练

参数设置：
- 批次尺寸256
- 热身步骤4000
- Epoch 200
- lr_mul 0.5
- 标签平滑
- 不要应用BPE和共享词汇
- 目标嵌入 /前智能线性层的重量共享。

测试

即将推出。

托多

对生成文本的评估。
注意重量图。

致谢

字节对编码零件是从子词-NMT借来的。
项目结构，某些脚本和数据集预处理步骤是从OpenNMT/OpenNMT-PY借来的。
感谢@srush，@iamalbert，@zessay，@julesgm，@zijianzhao和@huanghoujing的建议。

展开

附加信息

版本 1.0.0
类型其他源码
更新时间 2025-04-16
大小 27.53KB
来自于 Github

attention is all you need pytorch

您只需要注意：Pytorch实施

用法

WMT'16多模式翻译：DE-EN

0）下载Spacy语言模型。

1）用火炬和spacy进行预处理数据。

2）训练模型

3）测试模型

[（WIP）] WMT'17多模式翻译：de-en w/ bpe

1）使用BPE下载并预处理数据：

2）训练模型

3）测试模型（尚未准备就绪）

表现

训练

测试

托多

致谢

pytorch image models

爱无处不在

你会蜗牛吗

极品飞车移动版

你必须

你在那里

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express