Dieses Projekt bietet eine isländische TTS -Anwendung für den Android TTS -Service. Der aktuelle Stand des Projekts ist produktionsbereit .
Die App ist im Google Play Store verfügbar.
Símarómur bietet Zugang zu neuronalen Netzwerken, die über Vermögenswerte gebündelt sind.
Derzeit ist eine männliche Stimme namens Steinn verfügbar. Diese Stimme ist nicht nur sehr verständlich, sondern besitzt auch einen angenehmen und ansprechenden Ton, was sie zu einer vielseitigen, allgemeinen Option macht, die den Standard für isländische On-Device-Text-to-Speech-Technologie (TTS) festlegt. Es ist gut geeignet, sowohl kurze als auch lange Texte zu lesen und ein einheitliches Hörerlebnis zu bieten.
Derzeit entwickeln wir ein Multi-Sprecher-Modell, das eine weibliche Stimme beinhaltet, die für zukünftige Veröffentlichungen vorgesehen ist.
Benutzer können Normalisierungseinträge hinzufügen, um alternative Aussprachen von Wörtern oder Token aufzunehmen. Diese alternativen Aussprachen haben Vorrang vor den integrierten Normalisierungsregeln, wobei der angegebene Ersatz für solche Begriffe im gelesenen Text angewendet wird.
Um die Verwendung zu vereinfachen, können Austausch auf Graphem -Ebene vorgenommen werden, ohne dass die reguläre Expressionsyntax verstehen oder verwendet werden muss. Benutzer können sofort hören, wie der eingegebene Begriff und sein Ersatzstall mit der aktuellen Stimme mithilfe von Spieltasten verwendet werden.
Standardmäßig beginnt das Benutzernormalisierungswörterbuch leer. Derzeit wird das Import oder Export des Wörterbuchs nicht unterstützt.
Die isländische Textnormalisierung erfolgt vor dem Eintritt des Textes G2P. Lokales Voice G2P ist regelbasiert und wird mit den C ++-Frameworks Thrax & OpenFST implementiert, auf die über JNI zugegriffen wird.
Veraltete Flite -Stimmen und die ehemaligen neuronalen Netzwerkstimmen. Heutzutage sind Flite -Stimmen veraltet und wir verwenden stattdessen rein neuronale Netzwerkstimmen. Das Flite -Projekt ist kaum gewartet, und die Laufzeitleistung der neuronalen Netzwerkstimmen nähert sich schnell mit den Flite -Stimmen. Mit dem neuronalen Netzwerkmodell auf einem Pixel 6 -Telefon können wir 25x Echtzeitgeschwindigkeit erreichen.
Das neuronale Netzwerkmodell basiert auf Vits und über Piper TTS geschult.
Dieses Projekt verwendet unsere Versionen von OpenFST & Thrax mit den entsprechenden Korrekturen für Android im Zweig android . Bitte erstellen und installieren Sie diese zuerst, bevor Sie Símarómur zusammenstellen.
Für unsere CI -Jobs haben wir bereits alle abhängigen Bibliotheken vorgebaut und als GitHub -Release -Vermögen an ihrer entsprechenden Projektstelle veröffentlicht. Sie können diese nutzen und über die folgende Prozedur lokal in Ihrem Projektverzeichnis installieren:
Setzen Sie Umgebungsvariablen für die verwendeten Release -Versionen, z. B.: zB:
export OPENFST_TAG=1.8.1-android
export THRAX_TAG=1.3.6-androidDann führen Sie dieses Skript aus:
.github/scripts/dl_3rdparty.sh Dies sollte alle notwendigen Binärdateien in das Sub-Directory 3rdparty/ndk herunterladen und extrahieren.
Abrufen Sie das Sachverzeichnis der Sprachanlage durch
git submodule update --init Erstellen Sie dann die Datei local.properties wenn sie noch nicht vorhanden ist, und fügen Sie Variablen 3rdparty.dir für die installierten OpenFST/Thrax -Bibliotheken, z.
3rdparty.dir=/Users/fred/install-android
Oder falls Sie unsere Veröffentlichungen über dl_3rdparty.sh heruntergeladen haben, richten Sie diese Variablen in Ihr Projektverzeichnis simaromur/3rdparty/ndk , z.
3rdparty.dir=/Users/fred/projects/simaromur/3rdparty/ndk
Es kann auch erforderlich sein, die variable ndkVersion in App/Build anzupassen/zu kontrollieren. Abhängig von Ihrer installierten NDK -Version. Erstellen Sie dann das Projekt im Android Studio.
Sie können zu diesem Projekt beitragen, indem Sie es gaben, eine Filiale erstellen und eine neue Pull -Anfrage eröffnen.
Der gesamte Code ist Copyright © 2021-2024 Grammatek EHF. Dieser Code ist unter der Apache -Lizenz lizenziert.
Wir verwenden die 3. Party Libraries Sonic für Audiogeschwindigkeit und Pitch -Manipulation. Sonic ist Copyright 2010, 2011 von Bill Cox und ist unter der Apache -Lizenz lizenziert. Símarómur verwendet angepasste Versionen von Thrax und OpenFST für G2P. Diese sind auch unter der Apache -Lizenz lizenziert. Darüber hinaus verwenden wir OpenNLP für Tokenisierung und Satzaufteilung. OpenNLP ist unter der Apache -Lizenz lizenziert.
Ein großer Teil dieser Software wurde im Rahmen der Schirmherrschaft des 5-Jahres-Programms der isländischen Regierung, das hier und hier (Englisch) beschrieben wird, entwickelt.