attention networks for classification
1.0.0
ドキュメントには階層構造があり、単語が組み合わされて文を形成し、文章が組み合わさってドキュメントを形成することがわかっています。その構造を学ぶことを試みるか、この階層構造をモデルに入力して、既存のモデルのパフォーマンスを改善するかどうかを確認することができます。この論文は、その構造を活用して分類モデルを構築します。
これは、Pytorchのモデルの(緊密な)実装です。
爆発ブログのこの写真は、構造を完全に説明しています。

ノートブックには、IMDBムービーレビューデータセットのトレーニングモデルの例が含まれています。論文が言及した元のIMDBデータセットを入手できなかったので、このデータを使用しました
前処理されたデータはこちらから入手できます
私が得た最高の精度は、約0.35でした。このデータセットには、84919のサンプルと10クラスのみがあります。データセットのトレーニング損失は次のとおりです。
