
Dieses Repository begann als Erweiterung des Code of Asssigment 2 aus Standfords Deep Leaning -Kurs auf NLP. Nachdem ich die Aufgabe beendet hatte, habe ich versucht, den Code in etwas Nützliches zu verwandeln (Sie können beurteilen, ob ich dies in irgendeiner Form erreichen kann).
Ich habe ein RNN verwendet, um ein Sprachmodell zu erstellen, und damit habe ich einen Twitter -Bot erstellt. Es gibt einige Korpora im Ordner "Daten":
Der Datensatz der Penn Tree Bank (PTB).
Alle anspruchsvollen Tweets von Präsident Trump twitterten bisher (02. August 2017).
Alle Blog -Beiträge des brasilianischen Jornalists Leornardo Sakamoto haben bisher in seiner Website (02. August 2017) veröffentlicht.
Mit diesen Korpora habe ich drei verschiedene Bots erstellt: Ptbbot, Trumpbot und Sakabot (nicht sehr originelle Namen, ich weiß). Die allgemeine Idea ist, dass Sie alle möglichen Korpora verwenden können, um kreativere und lustigere Tweets zu generieren!
Zum Beispiel habe ich mit dem PTBBOT wundervolle Dinge wie folgt getwittert:

So installieren Sie alle erforderlichen Bibliotheken einfach:
$ sudo apt-get install python3-pip
$ pip3 install -r requirements.txt
Bevor Sie Ihre eigenen erstaunlichen Tweets erstellen, müssen Sie zuerst Ihre Bewerbung auf Twitter registrieren. Von nun an gehe ich davon aus, dass Sie alle wichtigen Informationen in einer Datei "Key.py" haben (diese Datei sollte im Ordner "Agent" enthalten sein).
Um einen vollständigen Test durchzuführen, können Sie einfach ausführen:
$ python3 src/test/test_all.py
Wenn jetzt alles in Ordnung ist, können Sie zum Ordner 'Tutorials' gehen, in dem sich alle Bots befinden. Verwenden wir den Trumpbot als Beispiel. Vor dem Schreiben eines Tweets müssen Sie das Modell trainieren:
$ cd src/tutorials/TrumpBot
$ python3 train.py
Nach dem Training können Sie mit dem Bot interagieren, um eine beliebige Anzahl von Tweets zu schreiben. einfach rennen
$ python3 write.py
Alle Tweets, die Sie aus dieser Interaktion geschrieben haben, werden im Ordner "Twitter_Draft" gespeichert. Angenommen, "Date.txt" ist eine Textdatei mit einigen Tweets. Sie können diese Datei bearbeiten und dann ausführen:
$ python3 post.py ./twitter_draft/date.txt -m 30
Der Bot veröffentlichen alle Tweets in einem Intervall von 30 Minuten mit dem Konto, das Sie in der Datei "Key.py" geschrieben haben.
Agent : Codes für das Verhalten des Bots.
Daten : Ordner mit allen Korpora.
Bilder : Bilder für die Datei readme.md
Test : Tests für jedes Modul.
text_processing : verschiedene Funktionen für die Textverarbeitung.
TFTOOLS : TensorFlow RNN -Modell- und Helferfunktionen.
Tutorials : Ordner mit den drei grundlegenden Bots.
Twitter : Tweepy -Funktionen.