NSC下載NSC源代碼下載

下載

神經情緒分類

神經情緒分類旨在用神經模型將情感分類為文檔，這一直是情感分類的最新方法。在這個項目中，我們提供了NSC，NSC+LA和NSC+UPA [Chen等，2016]的實現，其中通過對不同語義級別的關注來考慮用戶和產品信息。

對文檔級別情感分類的評估結果。 ACC。（準確性）和RMSE是評估指標。

在上表中，[Tang等人，2015年]報導了包括多數，Trigram，TextFeature，UPF，AVGWORDVEC，AVGWORDVEC，SSWE，RNTN + RNN，段落向量，JMARS和UPNN在內的基線模型。

我們在[下載]中提供了用於情感分類的IMDB，YELP13和YELP14數據集。該數據集應被解壓縮並放入文件夾NSC/，NSC+LA/或NSC+UPA/。

我們準備原始數據，以使其滿足代碼的輸入格式。原始數據集由論文[Tang等，2015]發布。 [下載]

在每個數據集（IMDB，yelp13，yelp14）上分別學習預訓練的單詞向量。

每個域中的數據集包含七個文件，使用以下格式：

訓練有素的模型可以在此鏈接上找到。

各種模型的源代碼都放在文件夾NSC/SRC，NSC+LA/SRC，NSC+UPA/SRC中。

對於培訓，您需要在每個模型的文件夾中鍵入以下命令：

 THEANO_FLAGS="floatX=float32,device=gpu" python train.py $dataset $class

其中數據集是相應的數據集文件夾，類是相應域的數量。

例如，我們在對IMDB文檔進行分類時使用以下命令：

 THEANO_FLAGS="floatX=float32,device=gpu" python train.py IMDB 10

培訓模型文件將保存在每個模型的文件夾模型/ BestModel中。

對於測試，您需要在每個模型的文件夾src/中鍵入以下命令：

 THEANO_FLAGS="floatX=float32,device=gpu" python test.py $dataset $class

其中數據集是相應的數據集文件夾，類是相應域的數量。

例如，我們在對IMDB文檔進行分類時使用以下命令：

 THEANO_FLAGS="floatX=float32,device=gpu" python test.py IMDB 10

報告準確性和RMSE的測試結果將顯示在屏幕上。

如果使用代碼，請引用以下論文：

[Chen等，2016] Huimin Chen，Maosong Sun，Cunchao Tu，Yankai Lin和Zhiyuan Liu。神經情緒分類與用戶和產品關注。在EMNLP的會議錄中。 [PDF]

[Chen等，2016] Huimin Chen，Maosong Sun，Cunchao Tu，Yankai Lin和Zhiyuan Liu。神經情緒分類與用戶和產品關注。在EMNLP的會議錄中。 [PDF]

[Tang等，2015] Duyu Tang，Bing Qin，Ting Liu。學習用戶和產品的語義表示，以進行文檔級別的情感分類。在EMNLP會議錄中。

展開

附加信息

相關應用

爲您推薦

相關資訊全部