
За последние годы рост онлайн -социальных сетей значительно способствовал тому, как люди общаются друг с другом. Основная контрмеза сравнения веб -сайтов с списком маркированных фальшивых источников новостей является негибкой, и поэтому желательный подход машинного обучения. Наш проект направлен на использование обработки естественного языка для непосредственного обнаружения фальшивых новостей, основываясь на текстовом содержании новостных статей.
Разработайте программу машинного обучения, чтобы определить, когда статья может быть фальшивыми новостями. Мы стремимся использовать корпус маркированных реальных и поддельных новостных статей для создания классификатора, который может принимать решения о информации, основанном на содержании из корпуса. Модель будет сосредоточена на выявлении фальшивых новостей.
train.csv: полный набор данных обучения со следующими атрибутами: ID: Уникальный идентификатор для новостей может быть неполной меткой: этикетка, которая отмечает статью как потенциально ненадежную 1: ненадежный 0: надежный
test.csv: набор данных обучения тестирования со всеми одинаковыми атрибутами на Train.csv без метки.
Clone the repo to your local machine-
> git clone https://github.com/sanikamal/fake-news-detector.git
> cd fake-news-detector
Make sure you have all the dependencies installed-
python 3.6+
numpy
pandas
matplotlib
sklearn
nltk
| Модель | Точность |
|---|---|
| Логистическая регрессия | 72,94% |
| Multinomialnb | 88,42% |
