bi att flow下载 - bi att flow源代码下载

bi att flow

其他源码

1.0.0

下载

机器理解的双向注意流

这是机器理解的双向注意流的原始实现。
可在此处提供用于小队排行榜提交的Codalab工作表。
有关TensorFlow V1.2兼容版本，请参见Dev Branch。
有关问题和建议，请联系Minjoon SEO（@seominjoon）。

0。要求

一般的

Python（经3.5.2验证。已报告了Python 2的问题！）
unzip，wget（仅用于运行download.sh ）

Python包

TensorFlow（深度学习库，仅在R0.11上工作）
NLTK（NLP工具，在3.2.1上进行了验证）
TQDM（进度栏，在4.7.4上进行了验证）
jinja2（用于签证；如果仅训练和测试，则不需要）

1。预处理

首先，准备数据。 Donwload Squad Data和Glove and NLTK语料库（〜850 MB，将文件下载到$HOME/data ）：

 chmod +x download.sh; ./download.sh

其次，预处理Stanford QA数据集（以及手套向量），并将其保存在$PWD/data/squad （〜5分钟）中：

 python -m squad.prepro

2。训练

该模型的参数约为250万。该模型接受了Nvidia Titan X的培训（Pascal Architecture，2016年）。该模型至少需要12GB的GPU RAM。如果您的GPU RAM小于12GB，则可以降低批量尺寸（性能可能会降低），也可以使用多GPU（请参见下文）。训练在〜18k步骤中收敛，每步花费了约4s（即约20小时）。

在培训之前，建议首先尝试以下代码来验证一切都可以，并且内存就足够了：

 python -m basic.cli --mode train --noload --debug

然后进行全面训练，跑步：

 python -m basic.cli --mode train --noload

您可以使用优化标志加快训练过程：

 python -m basic.cli --mode train --noload --len_opt --cluster

您仍然可以省略它们，但是培训会慢得多。

请注意，在培训期间，偶尔评估的EM和F1分数与官方小队评估脚本的分数不同。印刷分数不是官方的（我们的评分计划有点苛刻）。要获取官方号码，请使用官方评估员（在squad文件夹中复制squad/evaluate-v1.1.py ）。有关更多信息，请参见3.test。

3。测试

要测试，运行：

 python -m basic.cli

与培训类似，您可以给出优化标志以加快测试（在DEV数据上5分钟）：

 python -m basic.cli --len_opt --cluster

该命令在训练过程中加载了最近保存的模型，并开始对测试数据进行测试。该过程结束后，它将打印F1和EM分数，并输出一个JSON文件（ $PWD/out/basic/00/answer/test-####.json ####请注意，印刷分数不是正式的（我们的评分计划有点更苛刻）。要获取官方号码，请使用官方评估符（在squad文件夹中复制）和输出JSON文件：

 python squad/evaluate-v1.1.py $HOME/data/squad/dev-v1.1.json out/basic/00/answer/test-####.json

3.1从预训练的重量加载

您可以选择使用用于小队排行榜提交的预训练的权重，而不是自己训练模型。请参阅Codalab中的此工作表以重现结果。如果您不熟悉Codalab，请按照以下简单步骤（鉴于您遇到了上面的所有前提）：

从工作表下载save.zip ，然后在当前目录中解压缩。
从您的手套数据文件夹（ $HOME/data/glove/ ）复制glove.6B.100d.txt到当前目录。
复制单个模型：

 basic/run_single.sh $HOME/data/squad/dev-v1.1.json single.json

这在当前目录中写下了single.json的答案。然后，您可以使用官方评估者获得EM和F1分数。如果您想在GPU上运行（〜5分钟），请将Shell文件中的batch_size标志的值更改为更高的数字（12GB GPU RAM的60）。 4。同样，重现集合方法：

 basic/run_ensemble.sh $HOME/data/squad/dev-v1.1.json ensemble.json

如果您想在GPU上运行，则应通过在Forloop中删除'＆”来顺序运行脚本，否则您需要为每次for循环的每次运行指定不同的GPU。

结果

开发数据

请注意，这些分数来自官方评估者（在squad文件夹， squad/evaluate-v1.1.py中复制）。有关更多信息，请参见3.test。在培训期间出现的分数可能低于官方评估者的分数。

	EM（％）	F1（％）
单身的	67.7	77.3
合奏	72.6	80.7

测试数据

	EM（％）	F1（％）
单身的	68.0	77.3
合奏	73.3	81.1

有关更多详细信息，请参阅我们的论文。请参阅小队排行榜以与其他型号进行比较。

多GPU培训和测试

我们的模型支持多GPU培训。我们遵循Tensorflow教程中描述的并行化范式。简而言之，如果要使用60个批次大小（默认），但是如果您的3 GPU和4GB RAM，则将每个GPU初始化为20个GPU，并将CPU上的梯度组合在一起。这可以通过运行轻松完成：

 python -m basic.cli --mode train --noload --num_gpus 3 --batch_size 20

同样，您可以通过：

 python -m basic.cli --num_gpus 3 --batch_size 20

演示

现在，请参考此存储库的demo分支。

展开

附加信息

版本 1.0.0
类型其他源码
更新时间 2025-04-17
大小 136.66KB
来自于 Github

bi att flow

机器理解的双向注意流

0。要求

一般的

Python包

1。预处理

2。训练

3。测试

3.1从预训练的重量加载

结果

开发数据

测试数据

多GPU培训和测试

演示

GitHub sgrebnov/cordova plugin background download

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

Color Flow 3D手机版

流动

心流体验

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express