Curso de processamento de fala da YSDA
- Os materiais para cada semana estão nas pastas ./Week*
Programa do curso
- Semana 1: Slides | Palestra | Seminário
- Palestra: Introdução ao Processamento Digital de Sinais (DSP)
- Seminário: Implementar DSP Pipeline
- Semana 2: Slides | Palestra | Seminário
- Palestra: Introdução aos modelos discriminativos da fala nn. Detecção de atividades de voz (VAD) e tarefas de detecção de eventos de som (SED)
- Seminário: modelos de trem VAD
- Lição de casa: treinar modelos sed
- Semana 3: Slides | Palestra | Seminário
- Palestra: Palavras -chave e tarefas de biometria de fala
- Seminário: modelo de biometria de trem e veja as incorporações
- Lição de casa: modelo de biometria de treinar para melhor qualidade
- Semana 4: Slides | Palestra | Seminário
- Palestra: reconhecimento de fala i
- Seminário: Métricas e Auxípios para Reconhecimento de Fala
- Lição de casa: Implementar o algoritmo CTC
- Semana 5: Slides | Palestra
- Palestra: Reconhecimento da fala II, pré -treinamento
- Lição de casa: Finetune wav2vec2
- Semana 6: Slides | Palestra
- Palestra: Texto-fala I, Intro, pré-processador, métricas
- Semana 7: Slides | Palestra
- Palestra: Texto-fala II, modelos acústicos
- Seminário: Estimativa de Pitch, Alinhamento Monotônico Pesquisa de Estimativa de Duração do Fonema
- Lição de casa: modelo de trem Fastpitch
- Semana 8: Slides, P1 | Palestra, P1 | Slides, P2 | Palestra, P2 | Seminário
- Palestra, P1: Texto-fala III, vocoding
- Palestra, P2: quantização de vetores, codecs
- Seminário: Quantizaton vetorial, quantização de vetores residuais
- Semana 9: Slides | Palestra, P1 | Palestra, P2
- Palestra: Transformadores para TTS
- Lição de casa: Escreva inferência para transformador pré-treinado
- Semana 10: Slides | Palestra | Seminário
- Palestra: redução de ruído
- Seminário: Streaming STFT e ISTFT
- Lição de casa: Implementação do modelo de redução de ruído
- Semana 11: Slides | Palestra
- Palestra: Cancelamento de Echo acústico (AEC) e feixe de feixe
- Semana 12: Slides | Palestra | Seminário
- Palestra: ASR Inferência
- Seminário: Streaming ASR
- Semana 13: Slides | Palestra
- Palestra: TTS baseado em fluxo + conversão de voz
Colaboradores e equipe do curso
Atual:
- Alex Rak - Vad, Spotter, Biometria
- Mikhail Andreev - ASR
- Stepan Kargaltsev - ASR
- Evgeniia Elistrova - TTS
- Roman Kail - TTS
- Vladimir Platonov - TTS
- Evgenii Shabalin - TTS
- Ravil Khisamov - VQE
Iteração anterior:
- Andrey Malinin - Admin Curso, Palestras, Seminários, Trabalhos de casa
- Vladimir Kirichenko - Palestras, seminários, dever de casa
- Segey Dukanov - Lecures, seminários, trabalhos de casa