บอทวิจัยอ้างอิง
โครงการนี้จะสร้างบอทเครื่องมือค้นหาบนโทรเลขโดยใช้ TF IDF และความคล้ายคลึงกันของโคไซน์
เริ่มต้น
คำแนะนำเหล่านี้จะช่วยให้คุณได้รับสำเนาของโครงการและทำงานบนเครื่องในพื้นที่ของคุณเพื่อการพัฒนาและการทดสอบ ดูการปรับใช้สำหรับหมายเหตุเกี่ยวกับวิธีการปรับใช้โครงการในระบบสด
ข้อกำหนดเบื้องต้น
ตรวจสอบให้แน่ใจว่าคุณติดตั้ง Python 3 บนอุปกรณ์ของคุณ
โครงสร้างไฟล์
- bot.py ไฟล์นี้เพื่อให้บริการรับการอัปเดตและส่งข้อความจากคำขอ
- config.cfg โทเค็นโทรเลขบอทจากบอทพ่อ
- database.py กำหนดโครงสร้างฐานข้อมูลด้วยการแมปเชิงวัตถุ
- Search_Engine.py Custom Library เพื่อรับผลลัพธ์ของเอกสารความคล้ายคลึงกันของโคไซน์
- เซิร์ฟเวอร์ข้อความเสิร์ฟและผลลัพธ์จากเอ็นจิ้น
- tensor_flow.py การประมวลผลภาษาธรรมชาติสำหรับการตอบกลับทักทาย
- Intents.json คำทักทายหรือ intents ข้อมูล JSON
ขั้นตอนสำหรับรับชุดข้อมูล
- การขูดข้อมูลจาก http://digilib.uad.ac.id/penelitian/penelitian/index ดูที่ scrapping.ipynb
- อัปเดตชุดข้อมูล
วิธีการวิ่ง
- การติดตั้งข้อกำหนด
pip install -r requirements.txt
- ติดตั้ง
punkt ด้วย nltk.download()
>>> import nlit
>>> nltk.download("punkt")
- เรียกใช้
server.py
- ไปที่แอปพลิเคชัน Telegram หรือการเข้าถึงจาก Telegram Web จากนั้นแชทกับบอทนี้
สร้างขึ้นด้วย
- Python 3 - การเขียนโปรแกรมภาษาที่ใช้
- VirtualEnv - สภาพแวดล้อมเสมือนจริงที่ใช้
- SQL Alchemy - ห้องสมุดฐานข้อมูล
- NLTK - ชุดเครื่องมือภาษาธรรมชาติ
- Tensor Flow - Tensor Flow
- TF เรียนรู้ - เทนเซอร์โฟลว์สำหรับการเรียนรู้
- Scikit Learn - scikit เรียนรู้ใช้ความคล้ายคลึงกันของโคไซน์
โคลนหรือดาวน์โหลด
คุณสามารถโคลนหรือดาวน์โหลดโครงการนี้ได้
> Clone : git clone https://github.com/piinalpin/research-references-bot.git
แชท
- โทรเลขแชท: https://t.me/research_references_bot
- Line Bot Chat: http://line.me/ti/p/@437nryhw
ผู้เขียน
- Alvinditya Saputra - LinkedIn Instagram Twitter