Text-to-Speech-Ausrichtungsprojekt
Projektübersicht
Dieses Projekt untersucht und implementiert verschiedene Ausrichtungstechniken (Text-to-Speech), um die Qualität und Effizienz von TTS-Systemen zu verbessern. Unsere Arbeit erstreckt sich über mehrere Ansätze, die jeweils unterschiedliche Aspekte der Ausrichtungsherausforderung behandeln.
Projektstruktur
Dieses Repository ist in drei Hauptzweige organisiert, die jeweils einen bestimmten Ansatz zur TTS -Ausrichtung darstellen:
MoBoAligner
- Status : fertiggestellt, nur als Referenz
- Beschreibung : Inoffizielle Implementierung des "Moboaligner: Ein neuronales Ausrichtungsmodell für nicht autoregressive TTs mit monotoner Grenzsuche" Papier "
- Zweck : Lernen und Basisvergleich
- Einschränkung : Nicht für groß angelegte Anwendungen aufgrund maximaler Dauerbeschränkungen geeignet
RoMoAligner
- Status : Entwicklung gestoppt, nur als Referenz
- Beschreibung : Versuchsverbesserungsversuch, die grobe Ausrichtung mit Moboaligner kombinieren
- Zweck : Erforschen
- Einschränkung : Leistungsverbesserungen waren begrenzt und erfüllten die Erwartungen nicht
OTA ? Aktueller Fokus
- Status : In aktiver Planung und frühzeitiger Entwicklung
- Beschreibung : Anpassung der "One TTS -Ausrichtung, um sie alle zu regieren" (OTA) -Methode zur impliziten Pausemodellierung
- Ziel : Entwickeln Sie eine Lösung für den Umgang mit impliziten Pausen, ohne sich auf explizite Stille -Token zu verlassen
- Fortschritt : konzeptionelle Entwicklung und Planungsphase
Aktueller Fokus
Unser Hauptaugenmerk liegt auf dem OTA -Zweig, in dem wir Möglichkeiten untersuchen, die OTA -Methode für eine verbesserte Ausrichtung anzupassen, insbesondere bei der Behandlung implizite Pausen in der Sprache.
So verwenden Sie dieses Repository
- Weitere Informationen und Fortschritte für die Implementierung finden Sie in jeder Zweigstelle.
- Einzelzweigs Readmes finden Sie auf Setup- und Nutzungsanweisungen.
- Konzentrieren Sie sich für die neuesten Entwicklungen auf die
OTA -Filiale.
Beitragen
Wir begrüßen Beiträge zu unseren Zweigen. Wenn Sie einen Beitrag leisten möchten:
- Überprüfen Sie die Probleme in der entsprechenden Filiale auf Aufgaben, bei denen Sie helfen können.
- Geben Sie das Repository auf und erstellen Sie eine Pull -Anfrage mit Ihren Verbesserungen.
- Für wichtige Änderungen öffnen Sie zuerst ein Problem, um zu besprechen, was Sie ändern möchten.
Roadmap
Anerkennung
- Original Moboaligner Paper
- OTA -Papier
Wir schätzen die Unterstützung und das Interesse der TTS und der Sprachverarbeitungsgemeinschaft bei der Förderung dieser Forschung.