Der mit Kotlin + JETPack Compose + TensorFlow Lite entwickelte TTS -Motor kann vollständig offline verwendet werden.
Zwei optionale Modelle: Fastspeech und Tacotron, die beide aus Tensorflowtts stammen
Die Textmethode zu Pinyin stammt aus: TensorFlowtts_chinese
Da es sich um Echtzeit-Inferenzausgabe-Audio handelt, gibt es bestimmte Anforderungen an die Geräteleistung.
Unter ihnen ist Fastspeech schneller, aber das generierte Audio ist weniger anthropomorph und kann für gewöhnliche Mittelklasse oder über Mobiltelefone verwendet werden.
Tacotron hat hohe Leistungsanforderungen. Obwohl der Gesamteffekt besser ist, ist er sehr langsam, daher ist er derzeit von geringem praktischem Wert und nur zum Testen.
├─app/src/main/assets
│ baker_mapper.json
│ fastspeech2_quan.tflite
│ mb_melgan.tflite
│ tacotron2_quan.tflite
./gradlew assembleReleaseAdresse herunterladen
Netron
Reduzieren Sie die Binärdateigröße von Tensorflow Lite
Laden Sie AAR nach dem Zuschneiden herunter
Vergleich von ARR -Dateigrößen vor und nach dem Zuschneiden:
Tensorflowtts
TensorFlowtts_chinese
Tensorflow Guide
Referenz -TF -Test
Referenz -Tflite -Konvertierung
Google Pico TTS Quelle
$ git clone https://github.com/TensorSpeech/TensorFlowTTS.git
$ cd TensorFlowTTS
$ pip install .
$ pip install git+https://github.com/repodiac/german_transliterate.git$ cd models-tf
$ python test-h5.py$ python convert-tflite.py