fake news detector
1.0.0

최근 몇 년 동안 온라인 소셜 미디어의 성장은 사람들이 서로 의사 소통하는 방식을 크게 촉진했습니다. 웹 사이트를 레이블이 붙은 가짜 뉴스 소스 목록과 비교하는 기본 대응은 융통성이 없으므로 기계 학습 방식이 바람직합니다. 우리의 프로젝트는 자연 언어 처리를 사용하여 뉴스 기사의 텍스트 내용을 기반으로 가짜 뉴스를 직접 탐지하는 것을 목표로합니다.
기사가 가짜 뉴스 일 수있는시기를 식별하기 위해 기계 학습 프로그램을 개발하십시오. 우리는 라벨이 붙은 실제 및 가짜 뉴스 기사 코퍼스를 사용하여 코퍼스의 컨텐츠를 기반으로 정보에 대한 결정을 내릴 수있는 분류기를 구축하는 것을 목표로합니다. 이 모델은 가짜 뉴스를 식별하는 데 중점을 둘 것입니다.
TRAIN.CSV : 다음 속성이있는 전체 교육 데이터 세트 : ID : 뉴스 기사를위한 고유 ID 제목 : 뉴스 기사 제목 저자 : 뉴스 기사 텍스트 : 기사의 텍스트; 불완전한 레이블 : 기사를 잠재적으로 신뢰할 수없는 것으로 표시하는 레이블 : 1 : 신뢰할 수없는 0 : 신뢰할 수있는 레이블
test.csv : 레이블이없는 Train.csv에서 동일한 속성을 모두 갖춘 테스트 교육 데이터 세트.
Clone the repo to your local machine-
> git clone https://github.com/sanikamal/fake-news-detector.git
> cd fake-news-detector
Make sure you have all the dependencies installed-
python 3.6+
numpy
pandas
matplotlib
sklearn
nltk
| 모델 | 정확성 |
|---|---|
| 로지스틱 회귀 | 72.94% |
| Multinomialnb | 88.42% |
