神經情緒分類旨在用神經模型將情感分類為文檔,這一直是情感分類的最新方法。在這個項目中,我們提供了NSC,NSC+LA和NSC+UPA [Chen等,2016]的實現,其中通過對不同語義級別的關注來考慮用戶和產品信息。
對文檔級別情感分類的評估結果。 ACC。 (準確性)和RMSE是評估指標。 
在上表中,[Tang等人,2015年]報導了包括多數,Trigram,TextFeature,UPF,AVGWORDVEC,AVGWORDVEC,SSWE,RNTN + RNN,段落向量,JMARS和UPNN在內的基線模型。
我們在[下載]中提供了用於情感分類的IMDB,YELP13和YELP14數據集。該數據集應被解壓縮並放入文件夾NSC/,NSC+LA/或NSC+UPA/。
我們準備原始數據,以使其滿足代碼的輸入格式。原始數據集由論文[Tang等,2015]發布。 [下載]
在每個數據集(IMDB,yelp13,yelp14)上分別學習預訓練的單詞向量。
每個域中的數據集包含七個文件,使用以下格式:
訓練有素的模型可以在此鏈接上找到。
各種模型的源代碼都放在文件夾NSC/SRC,NSC+LA/SRC,NSC+UPA/SRC中。
對於培訓,您需要在每個模型的文件夾中鍵入以下命令:
THEANO_FLAGS="floatX=float32,device=gpu" python train.py $dataset $class
其中數據集是相應的數據集文件夾,類是相應域的數量。
例如,我們在對IMDB文檔進行分類時使用以下命令:
THEANO_FLAGS="floatX=float32,device=gpu" python train.py IMDB 10
培訓模型文件將保存在每個模型的文件夾模型/ BestModel中。
對於測試,您需要在每個模型的文件夾src/中鍵入以下命令:
THEANO_FLAGS="floatX=float32,device=gpu" python test.py $dataset $class
其中數據集是相應的數據集文件夾,類是相應域的數量。
例如,我們在對IMDB文檔進行分類時使用以下命令:
THEANO_FLAGS="floatX=float32,device=gpu" python test.py IMDB 10
報告準確性和RMSE的測試結果將顯示在屏幕上。
如果使用代碼,請引用以下論文:
[Chen等,2016] Huimin Chen,Maosong Sun,Cunchao Tu,Yankai Lin和Zhiyuan Liu。神經情緒分類與用戶和產品關注。在EMNLP的會議錄中。 [PDF]
[Chen等,2016] Huimin Chen,Maosong Sun,Cunchao Tu,Yankai Lin和Zhiyuan Liu。神經情緒分類與用戶和產品關注。在EMNLP的會議錄中。 [PDF]
[Tang等,2015] Duyu Tang,Bing Qin,Ting Liu。學習用戶和產品的語義表示,以進行文檔級別的情感分類。在EMNLP會議錄中。