
En los últimos años, el crecimiento de las redes sociales en línea ha facilitado enormemente la forma en que las personas se comunican entre sí. La contramedida básica de comparar sitios web con una lista de fuentes de noticias falsas etiquetadas es inflexible, por lo que es deseable un enfoque de aprendizaje automático. Nuestro proyecto tiene como objetivo utilizar el procesamiento del lenguaje natural para detectar noticias falsas directamente, basado en el contenido de texto de los artículos de noticias.
Desarrolle un programa de aprendizaje automático para identificar cuándo un artículo podría ser noticias falsas. Nuestro objetivo es utilizar un corpus de artículos de noticias reales y falsos etiquetados para construir un clasificador que pueda tomar decisiones sobre información basada en el contenido del corpus. El modelo se centrará en identificar noticias falsas.
Train.csv: un conjunto de datos de capacitación completo con los siguientes atributos: ID: ID único para una noticia Título del artículo: El título de un artículo de noticias Autor: Autor del artículo del artículo de noticias: El texto del artículo; podría ser una etiqueta incompleta: una etiqueta que marca el artículo como potencialmente poco confiable 1: poco confiable 0: confiable
test.csv: un conjunto de datos de entrenamiento de prueba con los mismos atributos en Train.csv sin la etiqueta.
Clone the repo to your local machine-
> git clone https://github.com/sanikamal/fake-news-detector.git
> cd fake-news-detector
Make sure you have all the dependencies installed-
python 3.6+
numpy
pandas
matplotlib
sklearn
nltk
| Modelo | Exactitud |
|---|---|
| Regresión logística | 72.94% |
| Multinomialnb | 88.42% |
