
該存儲庫最初是從Standford在NLP上深入傾斜課程中的Assigment 2的擴展。完成作業後,我嘗試將代碼轉換為有用的東西(您可以判斷我以任何形式實現這一目標)。
我使用RNN創建了語言模型,並創建了一個Twitter機器人。文件夾“數據”中有一些語料庫:
Penn Tree Bank(PTB)數據集。
到目前為止,所有總統的特朗普複雜推文都發了推文(2017年8月2日)。
迄今為止,巴西喬納爾·薩卡姆托(Leornardo Sakamoto)的所有博客文章都在他的網站上發布(2017年8月2日)。
有了這些語料庫,我創建了三個不同的機器人:PTBBOT,TRAMPBOT和SAKABOT(我知道不是很原始的名字)。一般的理論家是,您可以使用各種不同的語料庫來生成更具創造力和有趣的推文!
例如,使用ptbbot,我在推特上發了很棒的東西,例如:

要安裝所有必需的庫,只需運行:
$ sudo apt-get install python3-pip
$ pip3 install -r requirements.txt
在開始創建自己的驚人推文之前,必須先在Twitter上註冊您的應用程序。因此,從現在開始,我假設您在稱為“ key.py”的文件中擁有所有關鍵信息(此文件應在文件夾“代理”中)。
首先,要執行完整的測試,您可以簡單地運行:
$ python3 src/test/test_all.py
現在,如果一切正常,您可以轉到所有機器人所在的文件夾“教程”。讓我們以Trumpbot為例。在編寫任何推文之前,您需要訓練模型:
$ cd src/tutorials/TrumpBot
$ python3 train.py
訓練後,您可以與機器人進行互動以編寫任何數量的推文;只是跑
$ python3 write.py
您從此交互中寫的所有推文都將存儲在文件夾“ Twitter_draft”上。假設“ date.txt”是一個帶有一些推文的文本文件,您可以編輯此文件然後運行:
$ python3 post.py ./twitter_draft/date.txt -m 30
該機器人將使用您在文件“ key.py”中寫的帳戶的帳戶以30分鐘的間隔發布所有推文。
代理:編碼機器人行為。
數據:包含所有語料庫的文件夾。
圖像:文件readme.md的圖像
測試:每個模塊的測試。
text_processing :文本處理的不同功能。
tftools :Tensorflow RNN模型和輔助功能。
教程:具有三個基本機器人的文件夾。
Twitter :Tweepy功能。