
Nos últimos anos, o crescimento das mídias sociais on -line facilitou bastante a maneira como as pessoas se comunicam. A contramedida básica de comparar sites com uma lista de fontes de notícias falsas rotuladas é inflexível e, portanto, é desejável uma abordagem de aprendizado de máquina. Nosso projeto visa usar o processamento de linguagem natural para detectar notícias falsas diretamente, com base no conteúdo de texto dos artigos de notícias.
Desenvolva um programa de aprendizado de máquina para identificar quando um artigo pode ser uma notícia falsa. Nosso objetivo é usar um corpus de artigos de notícias reais e falsos rotulados para criar um classificador que possa tomar decisões sobre informações com base no conteúdo do corpus. O modelo se concentrará em identificar notícias falsas.
TRIN.CSV: Um conjunto de dados completo de treinamento com os seguintes atributos: ID: ID exclusivo para um artigo de notícias Título: O título de um artigo de notícias Autor: Autor do artigo do artigo noticiário: O texto do artigo; pode ser rótulo incompleto: um rótulo que marca o artigo como potencialmente não confiável 1: não confiável 0: confiável
test.csv: um conjunto de dados de treinamento de teste com todos os mesmos atributos em trens.csv sem o rótulo.
Clone the repo to your local machine-
> git clone https://github.com/sanikamal/fake-news-detector.git
> cd fake-news-detector
Make sure you have all the dependencies installed-
python 3.6+
numpy
pandas
matplotlib
sklearn
nltk
| Modelo | Precisão |
|---|---|
| Regressão logística | 72,94% |
| Multinomialnb | 88,42% |
