
พื้นที่เก็บข้อมูลนี้เริ่มต้นเป็นส่วนขยายของรหัส Assigment 2 จากหลักสูตรเอนกายลึกของ Standford บน NLP หลังจากเสร็จสิ้นการมอบหมายฉันพยายามแปลงรหัสในสิ่งที่มีประโยชน์ (คุณสามารถตัดสินได้ว่าฉันบรรลุสิ่งนั้นในรูปแบบใด ๆ )
ฉันใช้ RNN เพื่อสร้างรูปแบบภาษาและด้วยการที่ฉันสร้างบอท Twitter มี corpora บางส่วนในโฟลเดอร์ 'ข้อมูล':
ชุดข้อมูล Penn Tree Bank (PTB)
ประธานาธิบดีทรัมป์ทุกคนทวีตทวีตทวีตจนถึงตอนนี้ (02 ส.ค. , 2017)
โพสต์บล็อกทั้งหมดจากชาวบราซิล Jornalist Leornardo Sakamoto โพสต์ในเว็บไซต์ของเขา (02 ส.ค. , 2017)
ด้วย corpora เหล่านี้ฉันสร้างบอทที่แตกต่างกันสามบอท: Ptbbot, Trumpbot และ Sakabot (ไม่ใช่ชื่อดั้งเดิมมากฉันรู้) Ideia ทั่วไปคือคุณสามารถใช้ corpora ที่แตกต่างกันทุกประเภทเพื่อสร้างทวีตที่สร้างสรรค์และสนุกสนานมากขึ้น!
ตัวอย่างเช่นการใช้ ptbbot ฉันทวีตสิ่งที่ยอดเยี่ยมเช่น:

ในการติดตั้งไลบรารีที่ต้องการทั้งหมดเพียงแค่เรียกใช้:
$ sudo apt-get install python3-pip
$ pip3 install -r requirements.txt
ก่อนที่คุณจะเริ่มสร้างทวีตที่น่าทึ่งของคุณเองคุณต้องลงทะเบียนแอปพลิเคชันของคุณบน Twitter ก่อน ดังนั้นจากนี้ไปฉันสมมติว่าคุณมีข้อมูลคีย์ทั้งหมดในไฟล์ที่เรียกว่า "key.py" (ไฟล์นี้ควรอยู่ในโฟลเดอร์ "Agent")
ก่อนอื่นในการทำการทดสอบที่สมบูรณ์คุณสามารถเรียกใช้:
$ python3 src/test/test_all.py
ตอนนี้ถ้าทุกอย่างโอเคคุณสามารถไปที่โฟลเดอร์ 'บทช่วยสอน' ที่มีบอททั้งหมดอยู่ ลองใช้ trumpbot เป็นตัวอย่าง ก่อนเขียนทวีตใด ๆ ที่คุณต้องฝึกอบรมโมเดล:
$ cd src/tutorials/TrumpBot
$ python3 train.py
หลังจากการฝึกอบรมคุณสามารถโต้ตอบกับบอทเพื่อเขียนทวีตจำนวนใดก็ได้ แค่วิ่ง
$ python3 write.py
ทวีตทั้งหมดที่คุณเขียนจากการโต้ตอบนี้จะถูกเก็บไว้ในโฟลเดอร์ "Twitter_draft" สมมติว่า "date.txt" เป็นไฟล์ข้อความที่มีทวีตคุณสามารถแก้ไขไฟล์นี้แล้วเรียกใช้:
$ python3 post.py ./twitter_draft/date.txt -m 30
บอทจะโพสต์ทวีตทั้งหมดในช่วงเวลา 30 นาทีโดยใช้บัญชีที่คุณเขียนในไฟล์ "key.py"
ตัวแทน : รหัสสำหรับพฤติกรรมของบอท
ข้อมูล : โฟลเดอร์กับ Corpora ทั้งหมด
รูปภาพ : รูปภาพสำหรับไฟล์ readme.md
การทดสอบ : การทดสอบสำหรับทุกโมดูล
text_processing : ฟังก์ชั่นที่แตกต่างกันสำหรับการประมวลผลข้อความ
Tftools : ฟังก์ชั่น Tensorflow RNN และฟังก์ชั่นผู้ช่วย
บทเรียน : โฟลเดอร์ที่มีบอทพื้นฐานสามบอท
Twitter : ฟังก์ชั่น Tweepy