Wir wissen, dass Dokumente eine hierarchische Struktur haben, Wörter kombinieren zu Sätzen und Sätzen, die zu Dokumenten bilden. Wir können versuchen, diese Struktur zu lernen, oder wir können diese hierarchische Struktur in das Modell eingeben und sehen, ob sie die Leistung vorhandener Modelle verbessert. Dieses Papier nutzt diese Struktur zum Erstellen eines Klassifizierungsmodells.
Dies ist eine (enge) Implementierung des Modells in Pytorch.
Dieses Bild aus dem Explosionsblog erklärt die Struktur perfekt.

Das Notizbuch enthält ein Beispiel für ein geschultes Modell im IMDB Movie Review -Datensatz. Ich konnte den ursprünglichen IMDB -Datensatz, auf den das Papier Bezug genommen hat, nicht erhalten, daher habe ich diese Daten verwendet
Die vorverarbeiteten Daten sind hier verfügbar
Die beste Genauigkeit, die ich bekam, war ungefähr ~ 0,35. Dieser Datensatz hat nur 84919 Proben und 10 Klassen. Hier ist der Trainingsverlust für den Datensatz.
