
Этот репозиторий начался как расширение Кодекса Assigment 2 из глубинного курса Standford по NLP. После завершения задания я попытался преобразовать код во что -то полезное (вы можете судить, достигнут ли я этого в любой форме).
Я использовал RNN, чтобы создать языковую модель, и с этим я создал бота в Твиттере. В папке «Данные» есть некоторые корпусы:
Набор данных Penn Bank (PTB).
Все президент Трамп изысканных твитов написал в Твиттере до сих пор (02 августа 2017 г.).
Все сообщения в блоге от бразильского Джорналиста Леорнардо Сакамото опубликовали на своем сайте (02 августа 2017 г.).
С этими корпусами я создал три разных бота: Ptbbot, Trumpbot и Sakabot (я знаю не очень оригинальные имена). Генеральная IDeia заключается в том, что вы можете использовать все разные корпусы для создания более креативных и забавных твитов!
Например, используя Ptbbot, я написал в Твиттере замечательные вещи, такие как:

Чтобы установить все необходимые библиотеки.
$ sudo apt-get install python3-pip
$ pip3 install -r requirements.txt
Прежде чем начать создавать свои собственные удивительные твиты, вы должны сначала зарегистрировать свое приложение в Twitter. Итак, с этого момента я предполагаю, что у вас есть вся ключевая информация в файле с именем «key.py» (этот файл должен быть в папке «агент»).
Во -первых, чтобы выполнить полный тест, вы можете просто запустить:
$ python3 src/test/test_all.py
Теперь, если все в порядке, вы можете перейти в учебники с папкой, где расположены все боты. Давайте использовать Trumpbot в качестве примера. Перед написанием любого твита вам нужно тренировать модель:
$ cd src/tutorials/TrumpBot
$ python3 train.py
После обучения вы можете взаимодействовать с ботом, чтобы написать любое количество твитов; Просто беги
$ python3 write.py
Все твиты, которые вы написали из этого взаимодействия, будут храниться в папке "Twitter_draft". Предположим, что «date.txt» - это текстовый файл с несколькими твитами, вы можете отредактировать этот файл, а затем запустить:
$ python3 post.py ./twitter_draft/date.txt -m 30
Бот опубликует все твиты в интервале 30 минут, используя учетную запись, которую вы написали в файле «key.py».
Агент : коды для поведения бота.
Данные : папка со всеми корпусами.
Изображения : изображения для файла readme.md
Тест : тесты для каждого модуля.
Text_processing : разные функции для обработки текста.
TFTools : Tensorflow RNN модель и вспомогательные функции.
Учебные пособия : папка с тремя основными ботами.
Twitter : Tweepy Functions.