Скачать DeepMoji - DeepMoji исходный код скачать

DeepMoji

Другой исходный код

1.0.0

Скачать

------ обновление сентября 2023 г. ------

Онлайн -демонстрация больше не доступна, так как нам невозможно продлить сертификат. Код в этом репо все еще работает, но вам, возможно, придется внести некоторые изменения, чтобы он работал в Python 3 (см. Open PRS). Вы также можете проверить версию этого алгоритма Pytorch под названием Torchmoji, сделанный HuggingFace.

Deepmoji

(Нажмите изображение для демонстрации видео)

Deepmoji - это модель, обученная на 1,2 миллиарда твитов с эмодзи, чтобы понять, как язык используется для выражения эмоций. Благодаря обучению трансферу модель может получить современные результаты по многим задачам моделирования текста, связанными с эмоциями.

Смотрите документ или сообщение в блоге для получения более подробной информации.

Обзор

DeepMoji/ содержит весь базовый код, необходимый для преобразования набора данных в наш словарный запас и использование нашей модели.
Примеры/ содержит короткие фрагменты кода, показывающие, как преобразовать набор данных в наш словарный запас, загрузить модель и запустить его в этом наборе данных.
Сценарии/ содержит код для обработки и анализа наборов данных, чтобы воспроизвести результаты в статье.
модель/ содержит предварительную модель и словарный запас.
Данные/ содержат необработанные и обработанные наборы данных, которые мы включаем в этот репозиторий для тестирования.
Тесты/ содержит модульные тесты для кодовой базы.

Для начала загляните в примеры/ каталог. См. SCOST_TEXTS_EMOJIS.PY для использования DeepMoji для извлечения прогнозов Emoji, Encode_texts.py для преобразования текста в 2304-мерные векторы эмоциональных признаков или finetune_youtube_last.py для использования модели для обучения передачи на новом данных.

Пожалуйста, рассмотрите возможность ссылаться на нашу статью, если вы используете нашу модель или код (см. Ниже для цитирования).

Рамки

Этот код основан на керасах, который требует как Theano, так и Tensorflow в качестве бэкэнда. Если вы предпочитаете использовать Pytorch, здесь есть реализация, которая любезно предоставлена Томасом Вольком.

Установка

Мы предполагаем, что вы используете Python 2.7 с установленным PIP. В качестве бэкэнда вам нужно установить либо Theano (версия 0,9+), либо Tensorflow (версия 1.3+). Как только это будет сделано, вам нужно запустить следующее внутри корневого каталога, чтобы установить оставшиеся зависимости:

pip install -e .

Это установит следующие зависимости:

Керас (библиотека была проверена на версии 2.0.5, но все выше 2,0.0 должно работать)
Scikit-learn
H5Py
Текст-Unidecode
эмодзи

Убедитесь, что Keras использует выбранную вами бэкэнд. Вы можете найти инструкции здесь, под переключением от одного бэкэнда на другой раздел.

Запустите прилагаемый сценарий, который загружает предварительно подготовленные весы DeepMoji (~ 85 МБ) отсюда и помещает их в модель/ каталог:

python scripts/download_weights.py

Тестирование

Чтобы запустить тесты, установите нос. После установки перейдите к тестам/ каталогу и запустите:

nosetests -v

По умолчанию это также будет проходить тесты на создание. Эти тесты обучают модель для одной эпохи, а затем проверяют полученную точность, которая может занять несколько минут. Если вы предпочитаете исключить их, вместо этого запустите следующее:

nosetests -v -a ' !slow '

Отказ от ответственности

Этот код был протестирован для работы с Python 2.7 на машине Ubuntu 16.04. Он не был оптимизирован для эффективности, но должен быть достаточно быстрым для большинства целей. Мы не даем никаких гарантий, что нет ошибок - используйте код для вашей собственной ответственности!

Вклад

Мы приветствуем запросы на привлечение, если вы чувствуете, что что -то может быть улучшено. Вы также можете очень помочь нам, рассказав нам, что вы чувствуете, когда пишете свои последние твиты. Просто нажмите здесь, чтобы внести свой вклад.

Лицензия

Этот код и предварительно проведенная модель лицензированы по лицензии MIT.

Контрольные наборы данных

Контрольные наборы данных загружаются в этот репозиторий только в целях удобства. Они не были освобождены нами, и мы не требуем никаких прав на них. Используйте наборы данных для вашей ответственности и убедитесь, что вы выполняете лицензии, с которыми они были выпущены. Если вы используете какой -либо из наборов данных контрольных данных, пожалуйста, рассмотрите возможность ссылаться на оригинальных авторов.

Набор данных Twitter

К сожалению, мы не можем выпустить наш большой набор данных твитов в Твиттере с эмодзи, из -за ограничений лицензирования.

Цитирование

 @inproceedings{felbo2017,
  title={Using millions of emoji occurrences to learn any-domain representations for detecting sentiment, emotion and sarcasm},
  author={Felbo, Bjarke and Mislove, Alan and S{o}gaard, Anders and Rahwan, Iyad and Lehmann, Sune},
  booktitle={Conference on Empirical Methods in Natural Language Processing (EMNLP)},
  year={2017}
}

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-02-24
размер 270.72MB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

DeepMoji

------ обновление сентября 2023 г. ------

Deepmoji

Обзор

Рамки

Установка

Тестирование

Отказ от ответственности

Вклад

Лицензия

Контрольные наборы данных

Набор данных Twitter

Цитирование

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf