Двигатель TTS, разработанный с использованием Kotlin + JetPack Compose + Tensorflow Lite, может быть использован полностью в автономном режиме.
Две дополнительные модели: Fastspeech и Tacotron, оба из которых из Tensorflowtts
Метод текста к пининину происходит от: tensorflowtts_chinese
Поскольку это аудио вывод в реальном времени, есть определенные требования к производительности устройства.
Среди них Fastspeech быстрее, но сгенерированное звук менее антропоморфно и может использоваться на обычных мобильных телефонах среднего или выше.
Такотрон имеет высокопроизводительные требования. Хотя общий эффект лучше, он очень медленный, поэтому в настоящее время он имеет небольшую практическую ценность и только для тестирования.
├─app/src/main/assets
│ baker_mapper.json
│ fastspeech2_quan.tflite
│ mb_melgan.tflite
│ tacotron2_quan.tflite
./gradlew assembleReleaseСкачать адрес
Netron
Уменьшить размер бинарного файла TensorFlow Lite
Скачать AAR после обрезки
Сравнение размеров файлов ARR до и после обрезки:
TensorFlowtts
Tensorflowtts_chinese
Руководство по тензодару
Справочный тест TF
Ссылка на преобразование TFLITE
Google Pico TTS Source
$ git clone https://github.com/TensorSpeech/TensorFlowTTS.git
$ cd TensorFlowTTS
$ pip install .
$ pip install git+https://github.com/repodiac/german_transliterate.git$ cd models-tf
$ python test-h5.py$ python convert-tflite.py