Die Klassifizierung der neuronalen Stimmung zielt darauf ab, das Gefühl in einem Dokument mit neuronalen Modellen zu klassifizieren. In diesem Projekt bieten wir unsere Implementierungen von NSC, NSC+LA und NSC+UPA [Chen et al., 2016] an, in denen Benutzer- und Produktinformationen über Aufmerksamkeiten auf verschiedenen semantischen Ebenen berücksichtigt werden.
Evaluierungsergebnisse zur Klassifizierung der Stimmung auf Dokumentenebene. Acc. (Genauigkeit) und RMSE sind die Bewertungsmetriken. 
In der obigen Tabelle werden in [Tang et al., 2015] Basismodelle wie Mehrheit, Trigramm, Textfeature, UPF, AvgWordVec, Swey, Rntn + RNN, Absatzvektor, JMARS und UPNN angegeben.
Wir bieten IMDB-, Yelp13- und Yelp14 -Datensätze, die wir zur Klassifizierung der Sentiment in [Download] verwendet haben. Der Datensatz sollte dekomprimiert werden und in den Ordner NSC/, NSC+LA/oder NSC+UPA/eingesetzt werden.
Wir präsentieren die Originaldaten, um das Eingabeformat unserer Codes zu erfüllen. Die ursprünglichen Datensätze werden vom Papier veröffentlicht [Tang et al., 2015]. [Herunterladen]
Vorausgebildete Wortvektoren werden in jedem Datensatz (IMDB, yelp13, yelp14) getrennt gelernt.
Der Datensatz in jeder Domäne enthält sieben Dateien mit dem folgenden Format:
Das ausgebildete Modell finden Sie in diesem Link.
Die Quellcodes verschiedener Modelle werden in die Ordner NSC/SRC, NSC+LA/SRC, NSC+UPA/SRC eingesetzt.
Für das Training müssen Sie den folgenden Befehl im Ordner SRC/ jedes Modells eingeben:
THEANO_FLAGS="floatX=float32,device=gpu" python train.py $dataset $class
Wenn Datensatz der entsprechende Datensatzordner ist, ist die Klasse die Anzahl der entsprechenden Domäne.
Zum Beispiel verwenden wir den folgenden Befehl, wenn Sie das IMDB -Dokument klassifizieren:
THEANO_FLAGS="floatX=float32,device=gpu" python train.py IMDB 10
Die Trainingsmodelldatei wird im Ordnermodell/ Bestmodel/ jedes Modells gespeichert.
Zum Testen müssen Sie den folgenden Befehl im Ordner SRC/ jedes Modells eingeben:
THEANO_FLAGS="floatX=float32,device=gpu" python test.py $dataset $class
Wenn Datensatz der entsprechende Datensatzordner ist, ist die Klasse die Anzahl der entsprechenden Domäne.
Zum Beispiel verwenden wir den folgenden Befehl, wenn Sie das IMDB -Dokument klassifizieren:
THEANO_FLAGS="floatX=float32,device=gpu" python test.py IMDB 10
Das Testergebnis, das die Genauigkeit und die RMSE meldet, wird im Bildschirm angezeigt.
Wenn Sie den Code verwenden, zitieren Sie bitte das folgende Papier:
[Chen et al., 2016] Huimin Chen, Maosong Sun, Cunchao TU, Yankai Lin und Zhiyuan Liu. Klassifizierung neuronaler Stimmung mit Benutzer- und Produktaufmerksamkeit. In Proceedings of EMNLP. [PDF]
[Chen et al., 2016] Huimin Chen, Maosong Sun, Cunchao TU, Yankai Lin und Zhiyuan Liu. Klassifizierung neuronaler Stimmung mit Benutzer- und Produktaufmerksamkeit. In Proceedings of EMNLP. [PDF]
[Tang et al., 2015] Duyu Tang, Bing Qin, Ting Liu. Lernen semantische Darstellungen von Benutzern und Produkten für die Klassifizierung der Sentiments der Dokumentebene. In Proceedings of EMNLP.