이 repo에는 Python 3.9와 함께 Pytorch를 사용하여 시퀀스 분류 모델을 이해하고 구현하는 자습서가 포함되어 있습니다. 구체적으로, 우리는 영화 리뷰에서 감정을 예측하기 위해 모델을 훈련시킬 것입니다.
실수를 찾거나 설명에 동의하지 않으면 주저하지 말고 문제를 제출하십시오. 나는 긍정적이든 부정적인 피드백을 환영합니다!
pip install -r requirements.txt --upgrade 사용하여 필요한 종속성을 설치하십시오.
1- 단어의 신경 가방
이 튜토리얼은 Pytorch와의 시퀀스 분류 프로젝트의 워크 플로를 다룹니다. 간단하지만 효과적인 신경 가방 모델을 사용하여 시퀀스 분류의 기본 사항과 데이터 세트/TorchText Libaries를 사용하여 데이터로드/사전 처리를 단순화하는 방법을 다룹니다.
2- 재발 성 신경망
이제 우리는 기본 시퀀스 분류 워크 플로우를 다루었습니다.이 튜토리얼은 재발 성 신경망 (RNN) 모델로 전환하여 결과를 개선하는 데 중점을 둘 것입니다. 우리는 RNN의 이론을 다루고 RNN의 가장 일반적인 변형 중 하나 인 LSTM (Long Shom-Term Memory) RNN의 구현을 살펴 봅니다.
3- 컨볼 루션 신경 네트워크
다음으로, 감정 분석을 위해 CNN (Convolutional Neural Networks)을 다룹니다. 이 모델은 문장 분류를위한 Convolutional Neural Networks의 구현이 될 것입니다.
4- 변압기
마지막으로, 트랜스포머 라이브러리를 사용하여 미리 훈련 된 변압기 모델, 특히이 논문의 Bert 모델을로드하고 시퀀스 분류에 사용하는 방법을 보여줍니다.
이 튜토리얼의 이전 버전은 더 이상 사용할 수없는 Torchtext 라이브러리의 기능을 사용했습니다. 이것들은 레거시 디렉토리에 저장됩니다.
이 튜토리얼을 만드는 동안 내가 본 것들이 다음과 같습니다. 그 중 일부는 구식 일 수 있습니다.