Куративный список методов анализа настроений, реализаций и разной.
Анализ настроений - это область исследования, в которой анализируют мнения людей, настроения, оценки, отношения и эмоции из письменных языков. (Liu 2012)
Цель этого хранилища - предоставить адекватные связи для ученых, которые хотят исследовать в этой области; и в то же время будьте достаточно доступны для разработчиков, которые хотят интегрировать анализ настроений в свои приложения.
Анализ настроений происходит на разных уровнях:
Самые последние исследования фокусируются на аспектах, основанных на подходах. Но не все реализации OpenSource еще догнаны.
Есть много разных подходов, чтобы решить проблему. Лексические методы, например, смотрят на частоту слов, выражающих положительные и отрицательные чувства (из IE SentiWordnet), возникающие в данном предложении. Контролируемое машинное обучение, такое как наивное байеса и поддержка векторной машины (SVM), можно использовать с учебными данными. Поскольку примеры обучения трудно получить, машинное обучение без присмотра, такое как скрытое распределение Dirichlet (LDA) и вставки Word (Word2VEC), также используются на крупных немеченых наборах данных. Недавние работы также применяют методы глубокого обучения, такие как сверточная нейронная сеть (CNN) и длинная кратковременная память (LSTM), а также их варианты, основанные на внимании. Вы найдете более подробную информацию в документах по опросам.
Лю, Бинг. «Анализ настроений и добыча мнений». Синтез лекции по технологиям человеческого языка 5.1 (2012): 1-167. [PDF]
Винодхини Г. и Р.М. Чандрасекаран. «Анализ настроений и добыча мнений: опрос». Международный журнал 2.6 (2012): 282-292. [PDF]
Медхат, Валаа, Ахмед Хасан и Хода Кораши. «Алгоритмы анализа настроений и приложения: опрос». Ain Shams Engineering Journal 5.4 (2014): 1093-1113. [PDF]
Ван, Сида и Кристофер Д. Мэннинг. «Базовые линии и биграмс: простое, хорошее настроение и классификация тем». Материалы 50-го ежегодного собрания Ассоциации вычислительной лингвистики: короткие документы-тома 2. Ассоциация вычислительной лингвистики, 2012. [PDF]
Камбрия, Эрик, Даниэль Олшер и Дхерадж Раджагопал. «Senticnet 3: Обычная и здравый смысл базы знаний для анализа настроений, основанных на познании». Труды двадцать восьмой конференции AAAI по искусственному интеллекту. AAAI Press, 2014. [PDF]
AFINN: Список английских слов, оцененных для валентности [Web]
SentiWordnet: лексический ресурс, разработанный для поддержки анализа настроений. [Web] [Paper]
Перчатка: алгоритм получения векторов слов. Предварительные векторы слов доступны для скачивания [Web] [Paper]
Semeval14-task4: аннотированные аспекты и чувства обзоров ноутбуков и ресторанов. [Web] [Paper]
Стэнфордские настроения Treebank: набор данных настроений с мелкозернистыми аннотациями настроения [Web] [Paper]
Многомерная лексика для межличностного устремления [Web] [Paper]
Характеристики каждой реализации описаны.
Предостережения : ключевой проблемой в анализе настроений является его чувствительность к домену, из которой поступают либо обучающие данные, или в которой строится лексика настроения. [♠] Будьте осторожны, предполагая, что готовые реализации будут работать для вашей проблемы, обязательно посмотрите на предположения модели и подтвердите, точны ли они в вашем собственном домене [♦].
это Андажан/настроение: лексическое, на основе словарного, на основе Afinn.
Thinkroth/сентиментальный лексический, словарный, на основе Afinn.
Lingpipepipe: лексическое, основанное на корпусе, контролируемое машинное обучение
Corenlp: контролируемое машинное обучение, глубокое обучение
Асум: Неконтролируемое машинное обучение, скрытое распределение дирихлета. [бумага]
NLTK: инструмент анализа настроений Vader, лексический, на основе словаря, на основе правил. [бумага]
ViveKn/Sentiment: контролируемое машинное обучение, Наивный байесовский классификатор. [бумага]
Xiaohan2012/Twitter-Sent-DNN: контролируемое машинное обучение, глубокое обучение, сверточная нейронная сеть. [бумага]
Абдульфатир/Твиттер-сэдиент-анализ: анализ настроений на твитах с использованием наивного байеса, SVM, CNN, LSTM и т. Д.
kevincobain2000/sentiment_classifier: контролируемое машинное обучение, Наивный байесовский классификатор, максимальный энтропийный классификатор, Sentiwordnet.
Pedrobalage/SemevalaspeppepecebasedSententImentAnalysis: Аспекция, контролируемое машинное обучение, условное случайное поле.
Ganeshjawahar/Mem_absa: на основе аспектов, контролируемое машинное обучение, глубокое обучение, внешняя память, основанная на внимании. [бумага]
Openai/Generation-Reviews-раскрыть-предложение: глубокое обучение, Byte Mlstm [Paper]
yiyang-gt/социальное внимание: глубокое обучение, основанное на внимании. Использует позицию авторов в социальной сети для анализа настроений помощников. [бумага].
Thunlp/NSC: глубокое обучение, основанное на внимании. Использует пользовательскую и производственную информацию. [Paper].
Timjurka/Sentiment: контролируемое машинное обучение, Наивный классификатор Байеса.
Cdipaolo/Sentiment: контролируемое машинное обучение, Naive Bayes Classifier. На основе CDIPAOLO/GOML.
Malavbhavsar/Sentimentalizer: Lexical, Dictionary.
7compass/Sentimental: лексический, на основе словаря.
Amrish7/Dragon: контролируемое машинное обучение, Наивный классификатор Байеса.
?? Во -первых, спасибо, что нашли время внести свой вклад! ??
Шаги, чтобы внести свой вклад: