speech_course speech

speech_course

AI Исходный код

spring 2024

Скачать

Курс обработки речи YSDA

Материалы для каждой недели в папках ./week*

Курс программы

Неделя 1: слайды | Лекция | Семинар
- Лекция: вступление в цифровую обработку сигналов (DSP)
- Семинар: реализовать трубопровод DSP
Неделя 2: слайды | Лекция | Семинар
- Лекция: Введение в речь и дискриминационные модели. Задачи обнаружения голосовой активности (VAD) и звуковое обнаружение событий (SED)
- Семинар: модели Train VAD
- Домашнее задание: модели SED Train SED
Неделя 3: слайды | Лекция | Семинар
- Лекция: задачи по биометрии с ключевым словом и биометрии речи
- Семинар: модель биометрии поезда и посмотрите на встраивание
- Домашнее задание: модель биометрии поезда для лучшего качества
Неделя 4: слайды | Лекция | Семинар
- Лекция: распознавание речи I
- Семинар: метрики и дополнения для распознавания речи
- Домашнее задание: внедрять алгоритм CTC
Неделя 5: слайды | Лекция
- Лекция: распознавание речи II, предварительная подготовка
- Домашнее задание: Finetune wav2vec2
Неделя 6: слайды | Лекция
- Лекция: текст к речи I, вступление, препроцессор, метрики
Неделя 7: слайды | Лекция
- Лекция: текст к речи II, акустические модели
- Семинар: оценка высоты тона, монотонное выравнивание поиск оценки продолжительности фонем
- Домашнее задание: модель Fastpitch Train
Неделя 8: слайды, P1 | Лекция, P1 | Слайды, P2 | Лекция, P2 | Семинар
- Лекция, стр.: Текстовые к речи III, вокал
- Лекция, стр. 2: квантование вектора, кодеки
- Семинар: вектор Quantizaton, квантование остаточного вектора
Неделя 9: слайды | Лекция, P1 | Лекция, P2
- Лекция: трансформеры для TTS
- Домашнее задание: напишите вывод для предварительно обученного трансформатора
Неделя 10: слайды | Лекция | Семинар
- Лекция: снижение шума
- Семинар: потоковая передача STFT и ISTFT
- Домашнее задание: реализация модели шумоподавления
Неделя 11: слайды | Лекция
- Лекция: отмена акустического эха (AEC) и формирование луча
Неделя 12: слайды | Лекция | Семинар
- Лекция: вывод ASR
- Семинар: потоковая аср
Неделя 13: слайды | Лекция
- Лекция: преобразование голоса на основе потока.