QANetダウンロード - QANetソースコードのダウンロード

QANet

その他のソースコード

1.0.0

ダウンロード

Qanet

ICLR2018からのGoogleのQanet（以前は速い読解（FRC））のTensorflow実装。（注：これは、論文の著者からの公式の実装ではありません）

Qanetの実装に関するブログ投稿を書きました。詳細については、こちらをご覧ください！

トレーニングと前処理パイプラインは、hkust-knocompによってr-netから採用されています。デモモードが機能しています。トレーニング後、 python config.py --mode demoを使用して、インタラクティブなデモサーバーを実行します。

記憶の問題により、元の論文のように8ヘッドのマルチヘッドの注意とは対照的に、単一のヘッドドット製品の注意が使用されています。また、紙で使用されているP100と比較して、GTX1080の使用により、隠されたサイズは128から96に減少します。（8GBのGPUメモリは不十分です。12GBメモリGPUがある場合は、トレーニングの結果を共有してください。）

現在、最良のモデルは60kステップ（6〜8時間）でEM/F1 = 70.8/80.1に達しています。詳細な結果を以下に示します。

Alt text

データセット

このタスクに使用されるデータセットは、Stanfordの質問データセットです。単語に使用される840bのトークンを備えた一般的なクロールから得られた前処理された手袋の埋め込み。

要件

Python> = 2.7
numpy
TQDM
Tensorflow> = 1.5
Spacy == 2.0.9
ボトル（デモ専用）

使用法

データをダウンロードして前処理するには、実行します

 # download SQuAD and Glove
sh download.sh
# preprocess the data
python config.py --mode prepro

hkust-knowcompによるr-netと同様に、ハイパーパラメーターはconfig.pyに保存されます。デバッグ/トレーニング/テスト/デモに、実行します

python config.py --mode debug/train/test/demo

公式コードでモデルを評価するには、実行します

python evaluate-v1.1.py ~ /data/squad/dev-v1.1.json train/{model_name}/answer/answer.json

テンソルボードログファイルのデフォルトディレクトリはtrain/{model_name}/eventです

Dockerコンテナで実行（オプション）

Docker画像を構築するには（nvidia-dockerが必要）、実行します

 nvidia-docker build -t tensorflow/qanet .

ボリュームマウントパスとポートマッピングを設定します（デモモード用）

 export QANETPATH={/path/to/cloned/QANet}
export CONTAINERWORKDIR=/home/QANet
export HOSTPORT=8080
export CONTAINERPORT=8080

コンテナにバッシュします

 nvidia-docker run -v $QANETPATH:$CONTAINERWORKDIR -p $HOSTPORT:$CONTAINERPORT -it --rm tensorflow/qanet bash

コンテナ内に入ったら、分隊とグローブのデータセットをダウンロードすることから、上記のコマンドに従ってください。

事前に保護されたモデル

事前に保護されたモデルの重みは一時的に利用できません。

詳細な実装

このモデルは、Yoon Kimによるこのペーパーと同様の入力表現のための文字レベルの畳み込み - 最大プーリング - ハイウェイネットワークを採用しています。
エンコーダーは、位置エンコーディング - 深さごとの分離可能な畳み込み - 自己注意 - その間にレイヤーノルムを備えたフォワード構造を供給します。
200を使用している元の論文にもかかわらず、より小さな文字寸法を使用すると、より良い一般化につながることがわかります。
正則化のために、0.1のドロップアウトが2つのサブ層と2つのブロックごとに使用されます。
確率的深度ドロップアウトは、このモデルが残留接続に大きく依存するため、ネットワークの深さの増加に関する残留接続を落とすために使用されます。
クエリからコンテキストへの注意は、コンテキストからクエリへの注意とともに使用されます。これは、論文が報告したよりもパフォーマンスを改善するようです。これは、クエリからコンテキストへの注意が含まれる繰り返し情報を持っている可能性のある1つのヘッド（8つのヘッドとは対照的に）による自己注意の多様性の欠如による可能性があります。
学習率は、逆指数スケールで最初の1000ステップで0.0から0.001に増加し、1000ステップから0.001に固定されます。
推論では、このモデルは、すべてのグローバル変数の指数移動平均によって維持されるシャドウ変数を使用します。
このモデルでは、R-NETのトレーニング /テスト /前処理パイプラインを使用して、効率を向上させます。

結果

このリポジトリと元の論文の収集結果は次のとおりです。

モデル	トレーニング手順	サイズ	注意ヘッド	データサイズ（8月）	em	F1
私のモデル	35,000	96	1	87k（8月なし）	69.0	78.6
私のモデル	60,000	96	1	87k（8月なし）	70.4	79.6
私のモデル（@jasonbwによって報告）	60,000	128	1	87k（8月なし）	70.7	79.8
私のモデル（@chesterkuoによって報告）	60,000	128	8	87k（8月なし）	70.8	80.1
オリジナルペーパー	35,000	128	8	87k（8月なし）	Na	77.0
オリジナルペーパー	150,000	128	8	87k（8月なし）	73.6	82.7
オリジナルペーパー	340,000	128	8	240K（8月）	75.1	83.8

トド

モデルのトレーニングとテスト
コンテキストからクエリへの注意に三線機能を追加します
ドロップアウト +確率深度ドロップアウトを適用します
クエリからコンテキストへの注意
リアルタイムデモ
言い換えによるデータ増強
フルハイパーパラメーターでトレーニング（拡張データ、8つのヘッド、隠された単位= 128）

テンソルボード

視覚化のためにテンソルボードを実行します。

$ tensorboard --logdir=./

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-04-17
サイズ 186.37KB
から Github

QANet

Qanet

データセット

要件

使用法

Dockerコンテナで実行（オプション）

事前に保護されたモデル

詳細な実装

結果

トド

テンソルボード

Google Dorks

shepherd

mongo express

hidusbf

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express