
Selama beberapa tahun terakhir, pertumbuhan media sosial online telah sangat memfasilitasi cara orang berkomunikasi satu sama lain. Penanggulangan dasar membandingkan situs web dengan daftar sumber berita palsu berlabel tidak fleksibel, dan pendekatan pembelajaran mesin diinginkan. Proyek kami bertujuan untuk menggunakan pemrosesan bahasa alami untuk mendeteksi berita palsu secara langsung, berdasarkan konten teks artikel berita.
Kembangkan program pembelajaran mesin untuk mengidentifikasi kapan sebuah artikel mungkin menjadi berita palsu. Kami bertujuan untuk menggunakan kumpulan artikel berita nyata dan palsu berlabel untuk membangun classifier yang dapat membuat keputusan tentang informasi berdasarkan konten dari corpus. Model ini akan fokus mengidentifikasi berita palsu.
Train.csv: Dataset pelatihan penuh dengan atribut berikut: ID: ID Unik untuk Artikel Berita Judul: Judul Artikel Berita Penulis: Penulis Artikel Berita Teks: Teks artikel; bisa label tidak lengkap: label yang menandai artikel sebagai berpotensi tidak dapat diandalkan 1: tidak dapat diandalkan 0: andal
test.csv: Dataset pelatihan pengujian dengan semua atribut yang sama di train.csv tanpa label.
Clone the repo to your local machine-
> git clone https://github.com/sanikamal/fake-news-detector.git
> cd fake-news-detector
Make sure you have all the dependencies installed-
python 3.6+
numpy
pandas
matplotlib
sklearn
nltk
| Model | Ketepatan |
|---|---|
| Regresi logistik | 72,94% |
| Multinomialnb | 88,42% |
