Воспроизведение нейронного дискретного представления обучения
Проект курса для IFT 6135 -
Ссылка отчета о проекте: final_project.pdf
Инструкции
- Чтобы обучить VQVAE с аргументами по умолчанию, как обсуждалось в отчете, выполнить:
python vqvae.py --data-folder /tmp/miniimagenet --output-folder models/vqvae
- Чтобы обучить Pixelcnn до задержки, выполнить:
python pixelcnn_prior.py --data-folder /tmp/miniimagenet --model models/vqvae --output-folder models/pixelcnn_prior
Наборы данных протестированы
Изображение
- Мнист
- FashionMnist
- Cifar10
- Mini-Imagenet
Видео
- Atari 2600 - Код бокса (Openai Gym)
Реконструкции из VQ-Vae
4 лучших ряда - оригинальные изображения. Нижние 4 ряда являются реконструкциями.
Мнист

Мода Мнист

Образцы классов от VQVAE с Pixelcnn
Мнист

Мода Мнист

Комментарии
- Мы заметили, что реализация нашей собственной векторной функции Pytorch ускорила обучение VQ-Vae почти в 3 раза. Более медленный, но более простой код находится в этом коммите.
- Мы добавили некоторые основные тесты для функций квантования вектора (на основе
pytest ). Чтобы запустить эти тесты
Авторы
- Ритеш Кумар
- Тристан Делеу
- Эван Рака