Mesin TTS yang dikembangkan menggunakan Kotlin + Jetpack Compose + TensorFlow Lite dapat digunakan sepenuhnya offline.
Dua model opsional: fastspeech dan tacotron, keduanya berasal dari TensorFlowtts
Metode teks ke pinyin berasal dari: tensorflowtts_chinese
Karena ini adalah audio output inferensi real-time, ada persyaratan tertentu untuk kinerja perangkat.
Di antara mereka, FastSpeech lebih cepat, tetapi audio yang dihasilkan lebih sedikit antropomorfik, dan dapat digunakan pada ponsel mid-range biasa atau di atas ponsel.
Tacotron memiliki persyaratan kinerja tinggi. Meskipun efek keseluruhan lebih baik, sangat lambat, sehingga saat ini memiliki nilai praktis yang kecil dan hanya untuk pengujian.
├─app/src/main/assets
│ baker_mapper.json
│ fastspeech2_quan.tflite
│ mb_melgan.tflite
│ tacotron2_quan.tflite
./gradlew assembleReleaseAlamat unduhan
Netron
Kurangi ukuran file biner tensorflow lite
Unduh AAR setelah pemangkasan
Perbandingan Ukuran File ARR Sebelum dan sesudah Pangkas:
Tensorflowtts
Tensorflowtts_chinese
Panduan TensorFlow
Tes TF referensi
Referensi Konversi TFlite
Sumber Google Pico TTS
$ git clone https://github.com/TensorSpeech/TensorFlowTTS.git
$ cd TensorFlowTTS
$ pip install .
$ pip install git+https://github.com/repodiac/german_transliterate.git$ cd models-tf
$ python test-h5.py$ python convert-tflite.py