
In den letzten Jahren hat das Wachstum von Online -Social Media die Art und Weise, wie Menschen miteinander kommunizieren, erheblich erleichtert. Die grundlegende Gegenmaßnahme des Vergleichs von Websites mit einer Liste von gekennzeichneten Nachrichtenquellen ist unflexibel, und ein maschineller Lernansatz ist wünschenswert. Unser Projekt zielt darauf ab, natürliche Sprachverarbeitung zu verwenden, um gefälschte Nachrichten direkt auf der Grundlage des Textinhalts von Nachrichtenartikeln zu erkennen.
Entwickeln Sie ein maschinelles Lernprogramm, um festzustellen, wann ein Artikel gefälschte Nachrichten sein könnten. Wir wollen einen Korpus mit bezeichneten realen und gefälschten Nachrichtenartikeln verwenden, um einen Klassifikator zu erstellen, der Entscheidungen über Informationen treffen kann, die auf dem Inhalt des Korpus basieren. Das Modell konzentriert sich auf die Identifizierung gefälschter Nachrichten.
train.csv: Ein volles Trainingsdatensatz mit folgenden Attributen: ID: Eindeutige ID für einen Nachrichtenartikel Titel: Der Titel eines Nachrichtenartikels: Autor des Nachrichtenartikels Text: Der Text des Artikels; könnte unvollständig sein, ein Etikett, das den Artikel als potenziell unzuverlässig markiert 1: unzuverlässig 0: zuverlässig
test.csv: Ein Test -Trainingsdatensatz mit den gleichen Attributen bei train.csv ohne das Etikett.
Clone the repo to your local machine-
> git clone https://github.com/sanikamal/fake-news-detector.git
> cd fake-news-detector
Make sure you have all the dependencies installed-
python 3.6+
numpy
pandas
matplotlib
sklearn
nltk
| Modell | Genauigkeit |
|---|---|
| Logistische Regression | 72,94% |
| Multinomialnb | 88,42% |
