transformer pointer generator下载 - transformer pointer generator源代码下载

下载

通过变压器和指针生成器的抽象性汇总实现

当我想通过神经网络获得摘要时，我尝试了许多方法来生成摘要，但是结果不好。当我听到2018年字节杯时，我找到了一些有关它的信息，冠军的解决方案吸引了我，但是我找到了一些网站，例如Github Gitlab，我没有找到官方代码，因此我决定实施它。

我的模型是基于注意的是您所需要的，并提到了：用指针生成网络汇总

Pointer-Generator模型具有两种机制，它们是复制机制和覆盖机制，我发现了一些材料，它们显示了覆盖机制不适合简短摘要，因此我不使用这种机制，只使用第一个机制。
指针发电机模型的模型不足，这可以让损失得到NAN，我尝试了一些次并想解决它，但是结果是我不能，我认为原因是当计算最终物流师时，它将将词汇长度扩展到OOV和vocab长度，它将获得更多的零。因此，我删除了扩展最终物流师的机制，只需使用其从文章和vocab中使用其Deocode机制即可。关于它的详细信息，在这个模型中，我只使用单词而不是词汇，这个想法来自伯特。

步骤1。下载数据集，PWD为Ayn6，数据集按预处理为LCST，因此您会看到文件中的LCST在文件中的LCST中非常不同，每行都是抽象的，并且它们由“，” ，如果您担心数据集的数量在我和LCST之间是不同的，则不必担心数据的效果，就不会让数据集与数据集相同。
步骤2。运行以下命令。

 python train.py

检查hparams.py以查看可能的参数。例如，

 python train.py --logdir myLog --batch_size 32 --train myTrain --eval myEval

我的代码还可以改善多GPU来训练该模型，如果您有一个以上的GPU，就这样运行

 python train.py --logdir myLog --batch_size 32 --train myTrain --eval myEval --gpu_nums=myGPUNums