Sabemos que os documentos têm uma estrutura hierárquica, as palavras se combinam para formar frases e frases combinadas para formar documentos. Podemos tentar aprender essa estrutura ou podemos inserir essa estrutura hierárquica no modelo e ver se ela melhora o desempenho dos modelos existentes. Este artigo explora essa estrutura para construir um modelo de classificação.
Esta é uma implementação (próxima) do modelo em Pytorch.
Esta imagem do Blog Explosion explica a estrutura perfeitamente.

O notebook contém um exemplo de modelo treinado no conjunto de dados de revisão de filmes do IMDB. Não consegui obter o conjunto de dados IMDB original ao qual o artigo mencionou, então usei esses dados
Os dados pré -processados estão disponíveis aqui
A melhor precisão que recebi foi de ~ 0,35. Este conjunto de dados possui apenas 84919 amostras e 10 classes. Aqui está a perda de treinamento para o conjunto de dados.
