Download do fastVC - Download do código -fonte fastVC

fastVC

Código-Fonte de IA

1.0.0

Baixar

FastVC

Visão geral

O FastVC é uma ferramenta rápida e eficiente, não paralela e de conversão de voz (VC) . O VC envolve a modificação da voz de um alto -falante de origem para fazer parecer o de um alto -falante alvo, sem alterar o conteúdo linguístico da frase. Nossa ferramenta explora a tarefa em cascata em cascata de um modelo automático de reconhecimento de fala (ASR) e um modelo de texto para fala (TTS).

O ASR é baseado no wav2vec 2.0 e é usado para transcrever o discurso de um orador de origem. O TTS é baseado no SV2TTS e é usado para gerar a fala de saída a partir de uma incorporação do alto -falante alvo.

Para uma explicação mais detalhada, consulte o artigo do nosso projeto. Uma página de demonstração está disponível aqui.

Instalação e uso

O software foi implementado usando python 3.9.4

Clone o repositório ( git clone https://github.com/fmiotello/fastVC.git ) e digite o diretório ( cd fastVC )
( Opcional ) Crie Env virtual e ative -o: python -m venv env e source env/bin/activate (se estiver usando macOS/linux) ou .envScriptsactivate (se estiver usando o Windows)
Upgrade pip: python -m pip install --upgrade pip
Instale dependências: python -m pip install -r requirements.txt
Faça o download dos modelos pré -treinados (codificador, sintetizador, vocoder) e coloque -os nos diretórios corretos:

 ./src/encoder/saved_models/pretrained.pt
./src/synthesizer/saved_models/pretrained/pretrained.pt
./src/vocoder/saved_models/pretrained/pretrained.pt

Execute o script principal: python src/main.py (use --help para exibir opções disponíveis). O áudio de saída será ./src/audio/audio_out.wav .

Mais instruções podem ser encontradas aqui.

Notas

Esta aplicação foi desenvolvida como um projeto no Politecnico di Milano (MSC em música e engenharia acústica).

Luigi Attorresi
Federico Miotello
Eugenio poliuti

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-08-24
tamanho 6.51MB
Vindo de Github

Aplicativos Relacionados

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos