Этот проект предоставляет исландское приложение TTS для сервиса Android TTS. Текущее состояние проекта готова к производству .
Приложение доступно в магазине Google Play.
Símarómur предоставляет доступ к нейронной сети в виде голосов, которые связаны с активами.
В настоящее время доступен один мужской голос, названный Steinn . Этот голос не только очень понятен, но и обладает приятным и привлекательным тоном, что делает его универсальным, общим назначением опции, который устанавливает стандарт для исландской технологии текста в речь (TTS). Он хорошо подходит для чтения как коротких, так и длинных текстов, обеспечивая постоянный опыт прослушивания.
В настоящее время мы разрабатываем многопрофильную модель, которая будет включать женский голос, намеченный для будущего выпуска.
Пользователи могут добавить записи о нормализации, чтобы приспособить альтернативные произношения слов или токенов. Эти альтернативные произношения имеют приоритет по сравнению с встроенными правилами нормализации, применяя указанные замены для любых таких терминов, обнаруженных в считываемом тексте.
Чтобы упростить использование, замены могут быть сделаны на уровне графы без необходимости понимания или использования синтаксиса регулярного выражения. Пользователи могут немедленно услышать, как введенный термин и его запасной звук с помощью текущего голоса с помощью кнопок воспроизведения.
По умолчанию словарь нормализации пользователя начинается пустым. В настоящее время импорт или экспорт словаря не поддерживается.
Нормализация исландской текста выполняется до того, как текст входит в G2P. Local Voice G2P основан на правилах и реализуется с использованием Frameworks C ++ Thrax & OpenFST, доступ к которой доступны через JNI.
Умеренные голоса Flite и бывшие голоса нейронной сети. В настоящее время Flite Voices устарели, и вместо этого мы используем чисто голоса нейронной сети. Проект Flite едва ли поддерживается, и производительность времени выполнения голосов нейронной сети быстро закрывается на Flite Voices. Мы можем достичь 25 -кратной скорости в реальном времени с моделью нейронной сети на телефоне Pixel 6.
Модель нейронной сети основана на VIT и обучена через Piper TTS.
В этом проекте используются наши версии OpenFST & Thrax с соответствующими исправлениями для создания для Android внутри филиала android . Пожалуйста, постройте и установите их первым, прежде чем компилировать Símarómur.
Для наших рабочих мест CI мы уже предварительно построили все зависимые библиотеки и опубликованы как активы GitHub выпуска на соответствующем сайте проекта. Вы можете воспользоваться этим и установить их локально в каталоге проекта с помощью следующей процедуры:
Установите переменные среды для используемых версий релиза, например:
export OPENFST_TAG=1.8.1-android
export THRAX_TAG=1.3.6-androidЗатем запустите этот сценарий:
.github/scripts/dl_3rdparty.sh Это должно загружать и извлечь все необходимые двоичные файлы в подканальный 3rdparty/ndk .
Принесите голосовые активы подкаканатор через
git submodule update --init Затем создайте файл local.properties если он еще не существует, и добавьте переменные 3rdparty.dir для установленных библиотек OpenFST/Thrax, например,
3rdparty.dir=/Users/fred/install-android
Или в случае, если вы загрузили наши релизы через dl_3rdparty.sh , укажите эти переменные в свой каталог проекта simaromur/3rdparty/ndk , например:
3rdparty.dir=/Users/fred/projects/simaromur/3rdparty/ndk
Также может потребоваться адаптация/расставлена переменная ndkVersion внутри app/build.gradle в зависимости от вашей установленной версии NDK. Затем создайте проект внутри Android Studio.
Вы можете внести свой вклад в этот проект, разбив его, создав филиал и открыв новый запрос на притяжение.
Весь код-Copyright © 2021-2024 Grammatek EHF. Этот код лицензирован по лицензии Apache.
Мы используем 3 -й библиотеки Sonic для аудио скорости и манипуляции с высотой. Sonic - Copyright 2010, 2011, Билл Кокс и имеет лицензию по лицензии Apache. Símarómur использует адаптированные версии Thrax и OpenFST для G2P. Они также лицензированы по лицензии Apache. Кроме того, мы используем OpenNLP для токенизации и разделения предложений. OpenNLP лицензирован по лицензии Apache.
Большая часть этого программного обеспечения была разработана под эгидой 5-летней программы языковых технологий Исландского правительства, описанной здесь и здесь (английский).