
이 저장소는 NLP에 대한 Standford의 Deep Leaning Course에서 Assigment 2의 확장으로 시작되었습니다. 과제를 완료 한 후에는 코드를 유용한 것으로 변환하려고 시도했습니다 (어떤 형태로든이를 달성하는지 판단 할 수 있습니다).
RNN을 사용하여 언어 모델을 만들었고 Twitter 봇을 만들었습니다. 폴더 '데이터'에는 일부 공동체가 있습니다.
Penn Tree Bank (PTB) 데이터 세트.
모든 대통령 트럼프 대통령은 정교한 트윗이 지금까지 트윗했다 (2017 년 8 월 2 일).
브라질 Jornalist Leornardo Sakamoto의 모든 블로그 게시물은 지금까지 그의 사이트에 게시되었습니다 (2017 년 8 월 2 일).
이 Corpora를 사용하여 나는 Ptbbot, Trumpbot 및 Sakabot의 세 가지 봇을 만들었습니다 (원래 이름이 아님). 일반적인 Ideia는 모든 종류의 다른 Corpora를 사용하여보다 창의적이고 재미있는 트윗을 생성 할 수 있다는 것입니다!
예를 들어, ptbbot을 사용하여 다음과 같은 멋진 것들을 트윗했습니다.

필요한 모든 라이브러리를 설치하려면 실행 중입니다.
$ sudo apt-get install python3-pip
$ pip3 install -r requirements.txt
자신만의 놀라운 트윗을 만들기 전에 먼저 트위터에 응용 프로그램을 등록해야합니다. 따라서 지금부터 "key.py"라는 파일에 모든 주요 정보가 있다고 가정합니다 (이 파일은 폴더 "에이전트"에 있어야 함).
먼저, 완전한 테스트를 수행하려면 간단히 실행할 수 있습니다.
$ python3 src/test/test_all.py
이제 모든 것이 정상이라면 모든 봇이있는 폴더 '튜토리얼'으로 이동할 수 있습니다. 트럼프 보트를 예로 사용합시다. 트윗을 작성하기 전에 모델을 훈련시켜야합니다.
$ cd src/tutorials/TrumpBot
$ python3 train.py
훈련 후 봇과 상호 작용하여 여러 트윗을 작성할 수 있습니다. 그냥 실행
$ python3 write.py
이 상호 작용에서 쓴 모든 트윗은 "Twitter_draft"폴더에 저장됩니다. "date.txt"가 트윗이있는 텍스트 파일이라고 가정하면이 파일을 편집 한 다음 실행할 수 있습니다.
$ python3 post.py ./twitter_draft/date.txt -m 30
봇은 "key.py"파일에 작성한 계정을 사용하여 30 분 간격으로 모든 트윗을 게시합니다.
에이전트 : 봇의 행동에 대한 코드.
데이터 : 모든 Corpora가있는 폴더.
이미지 : 파일의 이미지 readme.md
테스트 : 모든 모듈에 대한 테스트.
Text_processing : 텍스트 처리를위한 다른 기능.
tftools : Tensorflow RNN 모델 및 도우미 기능.
튜토리얼 : 3 개의 기본 봇이있는 폴더.
트위터 : Tweepy Functions.