
ในช่วงไม่กี่ปีที่ผ่านมาการเติบโตของโซเชียลมีเดียออนไลน์ได้อำนวยความสะดวกอย่างมากกับวิธีที่ผู้คนสื่อสารกัน การตอบโต้ขั้นพื้นฐานของการเปรียบเทียบเว็บไซต์กับรายการแหล่งข่าวปลอมที่มีป้ายกำกับนั้นไม่ยืดหยุ่นและดังนั้นวิธีการเรียนรู้ของเครื่องจึงเป็นที่พึงปรารถนา โครงการของเรามีจุดมุ่งหมายที่จะใช้การประมวลผลภาษาธรรมชาติเพื่อตรวจจับข่าวปลอมโดยตรงตามเนื้อหาข้อความของบทความข่าว
พัฒนาโปรแกรมการเรียนรู้ของเครื่องเพื่อระบุว่าบทความอาจเป็นข่าวปลอมเมื่อใด เรามุ่งมั่นที่จะใช้คลังข้อมูลของบทความข่าวจริงและปลอมที่มีป้ายกำกับเพื่อสร้างตัวจําแนกที่สามารถตัดสินใจเกี่ยวกับข้อมูลตามเนื้อหาจากคลังข้อมูล แบบจำลองจะมุ่งเน้นไปที่การระบุข่าวปลอม
train.csv: ชุดข้อมูลการฝึกอบรมเต็มรูปแบบพร้อมแอตทริบิวต์ต่อไปนี้: ID: ID ที่ไม่ซ้ำกันสำหรับบทความข่าวชื่อ: ชื่อเรื่องของบทความข่าวผู้เขียน: ผู้เขียนบทความข่าวข้อความ: ข้อความของบทความ; อาจเป็นฉลากที่ไม่สมบูรณ์: ฉลากที่ทำเครื่องหมายบทความว่าอาจไม่น่าเชื่อถือ 1: ไม่น่าเชื่อถือ 0: เชื่อถือได้
test.csv: ชุดข้อมูลการฝึกอบรมการทดสอบที่มีแอตทริบิวต์เดียวกันทั้งหมดที่ train.csv โดยไม่มีฉลาก
Clone the repo to your local machine-
> git clone https://github.com/sanikamal/fake-news-detector.git
> cd fake-news-detector
Make sure you have all the dependencies installed-
python 3.6+
numpy
pandas
matplotlib
sklearn
nltk
| แบบอย่าง | ความแม่นยำ |
|---|---|
| การถดถอยโลจิสติก | 72.94% |
| MultinomialNB | 88.42% |
