Głosik
Głosik (ausgesprochen "gwoh-such") ist eine Beispiel-App, mit der das F5-TTS-Text-zu-Sprache-System mit MLX Swift vorgestellt wird. Der Name stammt aus dem polnischen Wort "Głos" (Stimme) mit dem winzigen Suffix "-ik".
Hier ist das ursprüngliche Repository der Implementierung: https://github.com/lucasnewman/f5-tts-swift
F5tts_demo.mp4
Sehen Sie sich die Demo oben an, um Głosik in Aktion zu sehen!
Anforderungen
- macOS 14.0 oder höher
- iOS 16.0 oder später
- Visionos 1.0 oder später
- Xcode 15.0 oder höher
- Swift 5.9 oder später
Installation
- Klonen Sie das Repository
- Öffnen Sie
Glosik.xcodeproj in Xcode - Bauen und führen Sie das Projekt aus
Verwendung
- Geben Sie den Text ein, den Sie in die Sprache konvertieren möchten
- (Optional) Aufzeichnung oder wählen Sie eine Referenz -Audio -Probe aus:
- Gehen Sie zur Registerkarte "Referenz"
- Notieren Sie ein neues Audio -Beispiel und geben Sie Referenztext an
- Speichern Sie es als Referenzprobe
- Wählen Sie es aus der Registerkarte "Referenzwählerin" "generieren"
- Klicken Sie auf "Sprache generieren", um das Audio zu erstellen
- Verwenden Sie die Wiedergabesteuerelemente, um die generierte Sprache anzuhören
- Speichern Sie das generierte Audio als WAV -Datei
Merkmale
Text-to-Rede-Erzeugung
- Hochwertige Sprachsynthese mit F5-TTS-Modell
- Fortschritt der Echtzeitgeneration
- Generation Timing Statistics
- GPU -Speicherverbrauchsüberwachung
Referenz -Audiounterstützung
- Notieren Sie neue Referenzproben mit dem Begleittext
- Verwalten Sie gespeicherte Referenzproben
- Wählen Sie Referenzproben für die Sprachgenerierung
- Wiederholungs -Referenzmuster abspielen
- Unterstützung für Mono, 24 kHz WAV -Format
Moderne UI
- Native Swiftui -Schnittstelle
- Split-View-Navigation
- Dunkelmodusunterstützung
- Plattformübergreifende Unterstützung (macOS, iOS, Visionos)
- Barrierefunktionen
Projektstruktur
Das Projekt ist in zwei Hauptteile unterteilt:
-
Glosik : Hauptanwendung -
GlosikUI : Wiederverwendbares Swiftui -Komponentenpaket
Lizenz
Dieses Projekt ist unter der MIT -Lizenz lizenziert. Weitere Informationen finden Sie in der Lizenzdatei.