
该存储库最初是从Standford在NLP上深入倾斜课程中的Assigment 2的扩展。完成作业后,我尝试将代码转换为有用的东西(您可以判断我以任何形式实现这一目标)。
我使用RNN创建了语言模型,并创建了一个Twitter机器人。文件夹“数据”中有一些语料库:
Penn Tree Bank(PTB)数据集。
到目前为止,所有总统的特朗普复杂推文都发了推文(2017年8月2日)。
迄今为止,巴西乔纳尔·萨卡姆托(Leornardo Sakamoto)的所有博客文章都在他的网站上发布(2017年8月2日)。
有了这些语料库,我创建了三个不同的机器人:PTBBOT,TRAMPBOT和SAKABOT(我知道不是很原始的名字)。一般的理论家是,您可以使用各种不同的语料库来生成更具创造力和有趣的推文!
例如,使用ptbbot,我在推特上发了很棒的东西,例如:

要安装所有必需的库,只需运行:
$ sudo apt-get install python3-pip
$ pip3 install -r requirements.txt
在开始创建自己的惊人推文之前,必须先在Twitter上注册您的应用程序。因此,从现在开始,我假设您在称为“ key.py”的文件中拥有所有关键信息(此文件应在文件夹“代理”中)。
首先,要执行完整的测试,您可以简单地运行:
$ python3 src/test/test_all.py
现在,如果一切正常,您可以转到所有机器人所在的文件夹“教程”。让我们以Trumpbot为例。在编写任何推文之前,您需要训练模型:
$ cd src/tutorials/TrumpBot
$ python3 train.py
训练后,您可以与机器人进行互动以编写任何数量的推文;只是跑
$ python3 write.py
您从此交互中写的所有推文都将存储在文件夹“ Twitter_draft”上。假设“ date.txt”是一个带有一些推文的文本文件,您可以编辑此文件然后运行:
$ python3 post.py ./twitter_draft/date.txt -m 30
该机器人将使用您在文件“ key.py”中写的帐户的帐户以30分钟的间隔发布所有推文。
代理:编码机器人行为。
数据:包含所有语料库的文件夹。
图像:文件readme.md的图像
测试:每个模块的测试。
text_processing :文本处理的不同功能。
tftools :Tensorflow RNN模型和辅助功能。
教程:具有三个基本机器人的文件夹。
Twitter :Tweepy功能。