Le moteur TTS développé à l'aide de Kotlin + Jetpack Compose + TensorFlow Lite peut être utilisé complètement hors ligne.
Deux modèles facultatifs: FastSpeech et Tacotron, qui sont tous deux de TensorFlowtts
La méthode du texte à pinyin vient de: Tensorflowtts_chinese
Parce qu'il s'agit de l'audio de sortie d'inférence en temps réel, il existe certaines exigences pour les performances de l'appareil.
Parmi eux, FastSpeech est plus rapide, mais l'audio généré est moins anthropomorphe et peut être utilisé sur des téléphones mobiles de milieu de gamme ordinaires ou supérieurs.
Le tacotron a des exigences de performance élevées. Bien que l'effet global soit meilleur, il est très lent, il est donc actuellement de peu de valeur pratique et est uniquement pour les tests.
├─app/src/main/assets
│ baker_mapper.json
│ fastspeech2_quan.tflite
│ mb_melgan.tflite
│ tacotron2_quan.tflite
./gradlew assembleReleaseAdresse de téléchargement
netron
Réduisez la taille du fichier binaire TensorFlow Lite
Téléchargez AAR après le recadrage
Comparaison des tailles de fichiers ARR avant et après la culture:
Tensorflowtts
Tensorflowtts_chinese
Guide de TensorFlow
Test de référence TF
Conversion de référence Tflite
Source Google Pico TTS
$ git clone https://github.com/TensorSpeech/TensorFlowTTS.git
$ cd TensorFlowTTS
$ pip install .
$ pip install git+https://github.com/repodiac/german_transliterate.git$ cd models-tf
$ python test-h5.py$ python convert-tflite.py