
Repositori ini dimulai sebagai perpanjangan dari Kode Assigment 2 dari kursus condong dalam Standford di NLP. Setelah menyelesaikan tugas, saya mencoba mengubah kode dalam sesuatu yang berguna (Anda dapat menilai jika saya mencapainya dalam bentuk apa pun).
Saya menggunakan RNN untuk membuat model bahasa dan dengan itu saya membuat bot Twitter. Ada beberapa korpora di folder 'data':
Dataset Penn Tree Bank (PTB).
Semua tweet Presiden Trump Tweeted sejauh ini (02 Agustus, 2017).
Semua posting blog dari jornalis Brasil Leornardo Sakamoto diposting sejauh ini di situsnya (02 Agustus, 2017).
Dengan korpora ini saya membuat tiga bot yang berbeda: PTBBOT, Trumpbot dan Sakabot (bukan nama asli, saya tahu). Ideia umum adalah Anda dapat menggunakan semua jenis korpora yang berbeda untuk menghasilkan tweet yang lebih kreatif dan menyenangkan!
Misalnya, menggunakan ptbbot saya tweetedll hal -hal indah seperti:

Untuk menginstal semua pustaka yang diperlukan, Jalankan saja:
$ sudo apt-get install python3-pip
$ pip3 install -r requirements.txt
Sebelum Anda mulai membuat tweet luar biasa Anda sendiri, Anda harus terlebih dahulu mendaftarkan aplikasi Anda di Twitter. Jadi, mulai sekarang saya berasumsi bahwa Anda memiliki semua informasi kunci dalam file yang disebut "key.py" (file ini harus ada di folder "agen").
Pertama, untuk melakukan tes lengkap, Anda cukup menjalankan:
$ python3 src/test/test_all.py
Sekarang, jika semuanya baik -baik saja, Anda dapat pergi ke folder 'tutorial' di mana semua bot berada. Mari kita gunakan Trumpbot sebagai contoh. Sebelum menulis tweet apa pun, Anda perlu melatih model:
$ cd src/tutorials/TrumpBot
$ python3 train.py
Setelah pelatihan, Anda dapat berinteraksi dengan bot untuk menulis sejumlah tweet; Jalankan saja
$ python3 write.py
Semua tweet yang Anda tulis dari interaksi ini akan disimpan di folder "Twitter_Draft". Misalkan "Date.txt" adalah file teks dengan beberapa tweet, Anda dapat mengedit file ini dan kemudian menjalankan:
$ python3 post.py ./twitter_draft/date.txt -m 30
Bot akan memposting semua tweet dalam interval 30 menit menggunakan akun yang Anda tulis di file "key.py".
Agen : Kode untuk perilaku bot.
Data : Folder dengan semua korpora.
Gambar : Gambar untuk file readme.md
Tes : Tes untuk setiap modul.
Text_processing : Fungsi yang berbeda untuk pemrosesan teks.
Tftools : Model TensorFlow RNN dan fungsi pembantu.
Tutorial : Folder dengan tiga bot dasar.
Twitter : Fungsi Tweepy.