NLP에 대한 딥 러닝
이 튜토리얼은 자연어 처리 영역에서 딥 러닝 알고리즘을 사용하는 소개입니다.
다음 소스에서 내용 (이론 및 코드)을 사용하여 준비됩니다.
- Python과의 딥 러닝, François Chollet의 예약
- 자연어 처리의 신경망 방법, Yoav Goldberg의 예약
- CS224D : 자연어 처리를위한 딥 러닝
Kaggle의 독성 의견 분류 챌린지 데이터 세트에 대한 코드를 연습하십시오
목차
사용 사례
- 시퀀스 분류
- 언어 탐지
- 카테고리 분류 (정서, 주제 등)
- 키워드 분류 (이름 성별, 장소/사람 이름)
- 서열 (seq2seq)
- 번역
- Gmail 스마트 답변
- 대화 AI : 채팅 봇
- 기타
- 이름, 이야기,시, 대화 생성기
- 이미지 캡션
- 음성 태깅의 일부
- 이름 엔티티 인식
시스템 설정
- 파이썬 3.6
- 씨
- virtualenv
- 도서관 :
재생할 데이터 세트
- IMDB 검토 데이터 세트
- Kaggle (독성 댓글 분류 챌린지) Wikipedia Comment Dataset
- 우분투 대화 코퍼 라
- 번역 데이터 세트
- 다른 데이터 세트
데이터 분석
- 일반 분석
시퀀스 표현
- 대표
- 하나의 뜨거운 인코딩
- 단어 임베딩
모델
- 클래스 모델 1에 포함됩니다 1
- 1 층 RNN (반복 신경 네트워크) 모델 2에 연결된 임베딩 모델 2 및 모델 2 확장
- 양방향 RNN 모델 3 및 모델 3 확장
현대적인 RNN 아키텍처
- 긴 단기 메모리 (LSTM)
- 게이트 재발 단위 (GRU)
- seq2seq
- 주목
- 빔 검색
케라
- API 및 키워드
- 최적화기
- 손실
- 활성화
- 메트릭
- 생산 및 추론에 모델을 배포합니다
모델 최적화 기술
- 탈락
- 시간을 통한 잘린 역전 (TBPTT)
- 사라지는 그라디언트 문제