Download de speech_course - speech_course do download do código -fonte

speech_course

Código-Fonte de IA

spring 2024

Baixar

Curso de processamento de fala da YSDA

Os materiais para cada semana estão nas pastas ./Week*

Programa do curso

Semana 1: Slides | Palestra | Seminário
- Palestra: Introdução ao Processamento Digital de Sinais (DSP)
- Seminário: Implementar DSP Pipeline
Semana 2: Slides | Palestra | Seminário
- Palestra: Introdução aos modelos discriminativos da fala nn. Detecção de atividades de voz (VAD) e tarefas de detecção de eventos de som (SED)
- Seminário: modelos de trem VAD
- Lição de casa: treinar modelos sed
Semana 3: Slides | Palestra | Seminário
- Palestra: Palavras -chave e tarefas de biometria de fala
- Seminário: modelo de biometria de trem e veja as incorporações
- Lição de casa: modelo de biometria de treinar para melhor qualidade
Semana 4: Slides | Palestra | Seminário
- Palestra: reconhecimento de fala i
- Seminário: Métricas e Auxípios para Reconhecimento de Fala
- Lição de casa: Implementar o algoritmo CTC
Semana 5: Slides | Palestra
- Palestra: Reconhecimento da fala II, pré -treinamento
- Lição de casa: Finetune wav2vec2
Semana 6: Slides | Palestra
- Palestra: Texto-fala I, Intro, pré-processador, métricas
Semana 7: Slides | Palestra
- Palestra: Texto-fala II, modelos acústicos
- Seminário: Estimativa de Pitch, Alinhamento Monotônico Pesquisa de Estimativa de Duração do Fonema
- Lição de casa: modelo de trem Fastpitch
Semana 8: Slides, P1 | Palestra, P1 | Slides, P2 | Palestra, P2 | Seminário
- Palestra, P1: Texto-fala III, vocoding
- Palestra, P2: quantização de vetores, codecs
- Seminário: Quantizaton vetorial, quantização de vetores residuais
Semana 9: Slides | Palestra, P1 | Palestra, P2
- Palestra: Transformadores para TTS
- Lição de casa: Escreva inferência para transformador pré-treinado
Semana 10: Slides | Palestra | Seminário
- Palestra: redução de ruído
- Seminário: Streaming STFT e ISTFT
- Lição de casa: Implementação do modelo de redução de ruído
Semana 11: Slides | Palestra
- Palestra: Cancelamento de Echo acústico (AEC) e feixe de feixe
Semana 12: Slides | Palestra | Seminário
- Palestra: ASR Inferência
- Seminário: Streaming ASR
Semana 13: Slides | Palestra
- Palestra: TTS baseado em fluxo + conversão de voz