Мы знаем, что документы имеют иерархическую структуру, слова объединяются для формирования предложений и предложений, объединяющихся для формирования документов. Мы можем попытаться узнать эту структуру или ввести эту иерархическую структуру в модель и посмотреть, улучшает ли она производительность существующих моделей. В этой статье используется эта структура для создания классификационной модели.
Это (близкая) реализация модели в Pytorch.
Эта картина из блога «Взрыв» прекрасно объясняет структуру.

Записная книжка содержит пример обученной модели в наборе данных обзора фильмов IMDB. Я не мог получить оригинальный набор данных IMDB, на который упоминался статья, поэтому я использовал эти данные
Предварительные данные доступны здесь
Лучшая точность, которую я получил, была около ~ 0,35. Этот набор данных имеет только 84919 образцов и 10 классов. Вот утрата обучения для набора данных.
