
Ce référentiel a commencé comme une extension du Code of Assigment 2 du cours de pente profond de Standford sur la PNL. Après avoir terminé l'affectation, j'ai essayé de transformer le code dans quelque chose d'utile (vous pouvez juger si j'accompagne sous quelque forme que ce soit).
J'ai utilisé un RNN pour créer un modèle de langue et avec cela, j'ai créé un bot Twitter. Il y a des corpus dans le dossier «données»:
L'ensemble de données de la Banque d'arborescence Penn (PTB).
Tout le président Trump Sophistiqué tweets a tweeté jusqu'à présent (02 août 2017).
Tous les articles de blog du jornaliste brésilien Leornardo Sakamoto ont publié jusqu'à présent sur son site (02 août 2017).
Avec ces corpus, j'ai créé trois robots différents: PTBBOT, Trumpbot et Sakabot (pas très originaux, je sais). L'idéia général est que vous pouvez utiliser toutes sortes de corpus différents pour générer des tweets plus créatifs et amusants!
Par exemple, en utilisant le PTBBOT, j'ai tweeté des choses merveilleuses comme:

Pour installer toutes les bibliothèques requises, il suffit d'exécuter:
$ sudo apt-get install python3-pip
$ pip3 install -r requirements.txt
Avant de commencer à créer vos propres tweets incroyables, vous devez d'abord enregistrer votre demande sur Twitter. Donc, à partir de maintenant, je suppose que vous avez toutes les informations clés dans un fichier appelé "key.py" (ce fichier doit être dans le dossier "agent").
Tout d'abord, pour effectuer un test complet, vous pouvez simplement exécuter:
$ python3 src/test/test_all.py
Maintenant, si tout va bien, vous pouvez accéder au dossier «tutoriels» où se trouvent tous les robots. Utilisons le Trumpbot comme exemple. Avant d'écrire un tweet, vous devez former le modèle:
$ cd src/tutorials/TrumpBot
$ python3 train.py
Après l'entraînement, vous pouvez interagir avec le bot pour écrire n'importe quel nombre de tweets; juste courir
$ python3 write.py
Tous les tweets que vous avez écrits à partir de cette interaction seront stockés sur le dossier "Twitter_Draft". Supposons que "Date.txt" soit un fichier texte avec quelques tweets, vous pouvez modifier ce fichier puis exécuter:
$ python3 post.py ./twitter_draft/date.txt -m 30
Le bot publiera tous les tweets dans un intervalle de 30 minutes en utilisant le compte que vous avez écrit dans le fichier "key.py".
Agent : codes pour le comportement du bot.
Données : dossier avec tous les corpus.
Images : Images pour le fichier readme.md
Test : tests pour chaque module.
Text_Processing : différentes fonctions pour le traitement de texte.
Tftools : modèle RNN TensorFlow et fonctions d'assistance.
Tutoriels : dossier avec les trois robots de base.
Twitter : Fonctions Tweep.