
このリポジトリは、NLPに関するスタンフォードの深い傾斜コースからのAssigment 2のコード2の拡張として始まりました。割り当てを終了した後、私はコードを何か有用なもので変換しようとしました(あらゆる形式で達成した場合は判断できます)。
RNNを使用して言語モデルを作成し、Twitterボットを作成しました。フォルダー「データ」にはいくつかのコーパスがあります。
Penn Tree Bank(PTB)データセット。
トランプ大統領のすべての洗練されたツイートは、これまでにツイートされました(2017年8月2日)。
ブラジルのジョルナリストであるレオルナルド・サカモトからのすべてのブログ投稿は、これまでに彼のサイトに投稿されました(2017年8月2日)。
これらのコーパスを使用して、PTBBOT、Trumpbot、Sakabotの3つの異なるボットを作成しました(あまりオリジナルの名前ではありません)。一般的なイデイアは、あらゆる種類の異なるコーパスを使用して、より創造的で楽しいツイートを生み出すことができるということです!
たとえば、ptbbotを使用して、次のような素晴らしいものをツイートしました。

必要なすべてのライブラリをインストールするには、実行するだけです。
$ sudo apt-get install python3-pip
$ pip3 install -r requirements.txt
独自の素晴らしいツイートの作成を開始する前に、最初にTwitterでアプリケーションを登録する必要があります。したがって、これからは、「key.py」というファイルにすべてのキー情報があると仮定しています(このファイルはフォルダー「エージェント」にあるはずです)。
まず、完全なテストを実行するには、単純に実行できます。
$ python3 src/test/test_all.py
これで、すべてが問題ない場合は、すべてのボットが配置されているフォルダー「チュートリアル」に移動できます。例としてトランプボットを使用しましょう。ツイートを書く前に、モデルをトレーニングする必要があります。
$ cd src/tutorials/TrumpBot
$ python3 train.py
トレーニング後、ボットと対話して、任意の数のツイートを書くことができます。実行するだけです
$ python3 write.py
このインタラクションから書いたすべてのツイートは、フォルダー「Twitter_Draft」に保存されます。 「date.txt」がいくつかのツイートを備えたテキストファイルであると仮定し、このファイルを編集してから実行できます。
$ python3 post.py ./twitter_draft/date.txt -m 30
ボットは、ファイル「key.py」に書いたアカウントを使用して、30分間の間隔ですべてのツイートを投稿します。
エージェント:ボットの動作のコード。
データ:すべてのコーパスを備えたフォルダー。
画像:ファイルreadme.mdの画像
テスト:すべてのモジュールのテスト。
text_processing :テキスト処理のさまざまな関数。
Tftools :Tensorflow RNNモデルとヘルパー機能。
チュートリアル:3つの基本ボットを備えたフォルダー。
Twitter :Tweepy機能。