El motor TTS desarrollado con Kotlin + Jetpack Compose + TensorFlow Lite se puede usar completamente fuera de línea.
Dos modelos opcionales: FastSpeech y Tacotron, los cuales son de Tensorflowtts
El método de texto a Pinyin proviene: TensorFlowtts_Chinese
Debido a que es audio de salida de inferencia en tiempo real, hay ciertos requisitos para el rendimiento del dispositivo.
Entre ellos, FastSpeech es más rápido, pero el audio generado es menos antropomórfico y puede usarse en los teléfonos móviles de rango medio ordinario o por encima.
Tacotron tiene requisitos de alto rendimiento. Aunque el efecto general es mejor, es muy lento, por lo que actualmente es de poco valor práctico y es solo para pruebas.
├─app/src/main/assets
│ baker_mapper.json
│ fastspeech2_quan.tflite
│ mb_melgan.tflite
│ tacotron2_quan.tflite
./gradlew assembleReleaseDirección de descarga
netron
Reducir el tamaño del archivo binario tensorflow lite
Descargar AAR después de recortar
Comparación de tamaños de archivo ARR antes y después del cultivo:
Tensorflowtts
Tensorflowtts_chinese
Guía de flujo tensor
Prueba de referencia TF
Conversión de referencia tflite
Fuente de Google Pico TTS
$ git clone https://github.com/TensorSpeech/TensorFlowTTS.git
$ cd TensorFlowTTS
$ pip install .
$ pip install git+https://github.com/repodiac/german_transliterate.git$ cd models-tf
$ python test-h5.py$ python convert-tflite.py