Глубокое обучение NLP
Этот учебник - это введение с использованием алгоритма глубокого обучения в области обработки естественного языка.
И он подготовлен с использованием контента (теория и код) из следующих источников:
- Глубокое обучение с Python, книга Франсуа Чолле
- Методы нейронной сети в обработке естественного языка, книга Йоава Голдберга
- CS224D: глубокое обучение для обработки естественного языка
Практическая код на набор данных о классификации токсичных комментариев Kaggle
Оглавление
Варианты использования
- Классификация последовательности
- Обнаружение языка
- Классификация категорий (настроение, темы и т. Д.)
- Классификация ключевых слов (GENDER, место, место/имя человека)
- Последовательность к последовательности (seq2seq)
- Перевод
- Gmail Smart Reply
- Разговорная ИИ: чат -боты
- Другие
- Имя, история, стихотворение, генератор диалога
- Подпись изображения
- Часть мечения речи
- Название объекта признание
Настройка системы
- Python 3.6
- пип
- Virtualenv
- Библиотеки:
- Керас
- Tensorflow
- Юпитер
- matplotlib
Наборы данных для игры
- Набор данных обзора IMDB
- Kaggle (Toxic Classification Challenge) Набор данных комментариев Википедии
- Ubuntu Dialog Corpora
- Набор данных перевода
- Другие наборы данных
Анализ данных
- Общий анализ
Представление последовательности
- Представительство
- Одна горячая кодировка
- Слово встраивание
- Предварительно обученные встраивания
Модели
- Встроение в класс модель 1
- Встроение, подключенное к 1 уровне RNN (рецидивирующая нейронная сеть) модель 2 и модель 2 расширенные
- Расширенная двунаправленная модель 3 и модель 3 и модель 3
Современная архитектура RNN
- Длинная кратковременная память (LSTM)
- Рецидив GATER (GRU)
- Seq2seq
- Внимание
- Лучший поиск
Керас
- API и ключевые слова
- Оптимизаторы
- Потеря
- Активация
- Метрики
- Развернуть модель для производства и вывода
Методы оптимизации модели
- Выбывать
- Усеченное обратное распространение во времени (TBPTT)
- Проблема градиента исчезает