attention networks for classification
1.0.0
우리는 문서가 계층 적 구조를 가지고 있으며, 단어를 결합하여 문장과 문장을 결합하여 문서를 형성합니다. 우리는 그 구조를 배울 수 있거나이 계층 구조를 모델에 입력하고 그것이 기존 모델의 성능을 향상시키는 지 확인할 수 있습니다. 이 논문은 분류 모델을 구축하기 위해 그 구조를 이용합니다.
이것은 Pytorch에서 모델의 (가까운) 구현입니다.
폭발 블로그 의이 그림은 구조를 완벽하게 설명합니다.

노트북에는 IMDB Movie Review 데이터 세트에서 훈련 된 모델의 예가 포함되어 있습니다. 논문이 언급 한 원래 IMDB 데이터 세트를 얻을 수 없으므로이 데이터를 사용했습니다.
전처리 된 데이터는 여기에서 사용할 수 있습니다
내가 얻은 최고의 정확도는 약 ~ 0.35였습니다. 이 데이터 세트에는 84919 개의 샘플과 10 개의 클래스 만 있습니다. 다음은 데이터 세트의 교육 손실입니다.
