O Tensorvox é um aplicativo projetado para permitir a síntese de fala neural fácil e fácil de usar na área de trabalho, com o objetivo de aumentar a acessibilidade a essa tecnologia.
Atendido principalmente por tensorflowtts e também por coqui-tts e vits, é escrito em C ++/QT puro, usando a API do tensorflow c para interagir com os modelos Tensorflow (dois primeiros) e libtorch para pytorch. Dessa forma, podemos realizar inferência sem precisar instalar gigabytes no valor de bibliotecas Python, apenas algumas DLLs.
Guia detalhado no Google Docs
Pegue uma cópia dos lançamentos, extraia o .zip e verifique a pasta do Google Drive quanto a modelos e instruções de instalação
Se você estiver interessado em usar seu próprio modelo, primeiro você precisa treinar, exportá -lo.
O Tensorvox suporta modelos de três repositórios:
Esses dois exemplos devem fornecer orientações suficientes para entender o que é necessário. Se você deseja treinar um modelo especificamente para esse fim, recomendo o TensorFlowtts, pois é o melhor com o melhor suporte e o VITs, pois é a coisa mais próxima de aperfeiçoar para idiomas, o suporte pronta para uso é fornecido para o inglês (coqui e tftts, vits), alemão e espanhol (apenas tensorflowtts); Ou seja, você não terá que fazer nada. Você pode adicionar idiomas sem modificar o código, desde que o conjunto de fonemas seja IPA (estressado ou não exposto), ARPA ou Globalphone (abra um problema e eu explicarei para você)
Atualmente, apenas o Windows 10 X64 (embora eu tenha ouvido relatórios sobre isso em 8.1) é suportado.
Requisitos:
Construção preparada (com todas as bibliotecas fornecidas):
deps esteja no mesmo local que os arquivos de origem .Pro e principal.Observe que, para experimentar o seu novo executável brilhante, você precisará baixar um lançamento do programa, conforme descrito acima, e substitua o executável nessa versão pelo seu novo, para ter todas as DLLs no local.
TODO: Adicione instruções para compilar do zero.
Libtorch : https://pytorch.org/cppdocs/installing.html
Tensorflow C API : https://www.tensorflow.org/install/lang_c
CPPFlow (TF C API -> C ++ Wrapper): https://github.com/serizba/cppflow
Audiofile (para exportação WAV): https://github.com/adamstark/audiofile
Janela de estilo escuro sem moldura : https://github.com/jorgen-vikkinggod/qt-framless-window-garkstyle
JSON for Modern C ++ : https://github.com/nlohmann/json
R8Brain-Free-src (reamostragem): https://github.com/avaneev/r8brain-free-src
rnnoise (versão cmake, saída denoising): https://github.com/almogh52/rnnoise-cmake
Iluminação LED LOGITECH SDK (Integração do Mouse RGB): https://www.logitechg.com/en-us/innovation/developer-lab.html
Qcustomplet : https://www.qcustomplet.com/index.php/introduction
libnumbertext : https://github.com/numbertext/libnumberText
Você pode abrir um problema aqui ou ingressar no servidor Discord e discutir/perguntar qualquer coisa lá
Para mídia/licenciamento/quaisquer outras consultas formais, envie para este e -mail: [email protected]
Este programa em si é licenciado pelo MIT, mas para os modelos que você usa, os termos de licença deles se aplicam. Por exemplo, se você estiver no Vietnã e usando modelos TensorFlowTTs, terá que verificar aqui para alguns detalhes