O mecanismo TTS desenvolvido usando Kotlin + Jetpack Compose + Tensorflow Lite pode ser usado completamente offline.
Dois modelos opcionais: FastSpeech e Tacotron, ambos de Tensorflowtts
O método de texto para Pinyin vem de: tensorflowtts_chinese
Por ser o áudio de saída de inferência em tempo real, existem certos requisitos para o desempenho do dispositivo.
Entre eles, o FastSpeech é mais rápido, mas o áudio gerado tem um efeito de antropomorfismo ruim e pode ser usado em telefones celulares ou acima dos telefones celulares comuns.
O Tacotron possui requisitos de alto desempenho. Embora o efeito geral seja melhor, é muito lento, por isso é atualmente de pouco valor prático e é apenas para teste.
├─app/src/main/assets
│ baker_mapper.json
│ fastspeech2_quan.tflite
│ mb_melgan.tflite
│ tacotron2_quan.tflite
./gradlew assembleReleaseEndereço para download
Netron
Reduza o tamanho do arquivo binário do tensorflow lite
Baixe Aar após o Cropping
Comparação dos tamanhos de arquivo ARR antes e após o corte:
Tensorflowtts
Tensorflowtts_chinese
Guia do Tensorflow
Teste TF de referência
Referência Tflite Conversão
Fonte do Google Pico TTS
$ git clone https://github.com/TensorSpeech/TensorFlowTTS.git
$ cd TensorFlowTTS
$ pip install .
$ pip install git+https://github.com/repodiac/german_transliterate.git$ cd models-tf
$ python test-h5.py$ python convert-tflite.py