O Minimania é um aplicativo da Web que fornece recursos de texto em fala (TTS) e clonagem de voz. O aplicativo utiliza modelos de aprendizado profundo para gerar saída de fala de alta qualidade em vários idiomas, com opções para personalizar o tom, a velocidade e o volume do áudio gerado. O motor TTS da Minimania é construído no topo dos modelos Tacotron 2 e Wave Glow, enquanto seus recursos de clonagem de voz são baseados nos modelos FastSpeech e Melgan.
Clique no mega link para ver a demonstração: link para o vídeo
Antes de instalar e usar o Mimicmania, você precisará baixar e instalar o seguinte:
apt-get install ffmpeg no seu terminal.sudo apt-get install espeak-ng no seu terminal.sudo apt-get install espeak no seu terminal.Além disso, você também precisará baixar as dependências do módulo e Python necessárias, conforme descrito na próxima seção.
Para instalar e executar o Mimicmania, siga estas etapas:
git clone https://github.com/everydaycodings/MimicMania.gitcd MimicManiapython setup.py para baixar os módulos necessários. Esse processo pode levar algum tempo, pois o módulo necessário é de cerca de 6 GB.pip install -r requirements.txt para baixar todas as dependências do Python.streamlit run app.py para iniciar o aplicativo da web. Se você deseja contribuir para o Mimicmania, bire o repositório e crie uma solicitação de tração. Congratulamo -nos com contribuições de todos os tipos, incluindo correções de bugs, novos recursos e melhorias de documentação.
A Mimicmania foi desenvolvida por Kumar Saksham (todos os dias de todos os dias com a ajuda de vários recursos de código aberto.
Gostaríamos de agradecer especial a Coqui-AI/TTS por fornecer seu modelo de texto em fala como um recurso para o nosso projeto.
Mimicmania é licenciada sob a licença do MIT.
Se você tiver alguma dúvida ou problemas com o Mimicmania, entre em contato conosco em todos os [email protected] ou entre em contato conosco no Twitter @everydaycodings ou médio @everydaycodings.
Estamos sempre felizes em ajudar!