VoiceToSpeech -Download - VoiceToSpeech Quellcode Download

VoiceToSpeech

AI-Quellcode

1.0.0

Herunterladen

Stimme zur Sprache

Voice to Speech ist ein im Browser-Client-Seite-Dienst, der die Stimme eines Benutzers in synthetisierte Sprache durch Spracherkennung, Hunderte von Stimmen, Text-to-Sprache (TTS), Sprachautomatikübertragung und Socket-Unterstützung umwandelt.

Bekannt unterstützte Browser: Chrome, Edge, Safari

Besuchen Sie https://shadowforests.github.io/voicetspeech/, um Voice zur Sprache zu verwenden.

Merkmale

Live -Spracherkennung über Web -Sprach -API (nur auf Chrome).
Latenz-Sprach-zu-Sprache unter Verwendung der vorläufigen Spracherkennungsergebnisse.
Alternative Text-to-Speech-Eingabe für die feine Steuerung der Ausgabe.
Automatische Übersetzung von Eingabesprachensprache zur Ausgabe von Sprachsprache.
Große Auswahl von Sprachen und Dialekten für Spracherkennung und Stimmen.
Beinhaltet Unterstützung für Stimmen auf Ihrem Computer und integriert in Ihrem Browser.
Passen Sie Audioeingangs- und Ausgabegeräte an.
Passen Sie das Ausgangsvolumen sowie die Tonhöhe und Rate für ausgewählte Stimmen an.
Live -Sprachausgabe -Transkript mit Wiedergabeunterstützung für alle Transkriptionseinträge.
Durch Auswählen des gesamten Textes auf der Seite wird nur der Transkripttext ausgewählt, sodass eine einfache Kopiepaste ermöglicht wird.
Live -Diagnostik für Spracherkennung Ausgabe, Vertrauen und Fehler.
Verwenden Sie einen Web -Socket, um Sprachausgabe Text direkt an Ihren PC zu senden.
Verwenden Sie zwei Instanzen, um eine bidirektionale Übersetzung zwischen Ihnen und jemand anderem zu ermöglichen.

Web -Socket

Sie können einen Web -Socket -Server auf Ihrem PC einrichten, um Sprachausgabetext direkt an Ihren PC zu senden. In diesem Repository finden Sie ein Beispiel, das Sie mit dem Knoten ausführen können. Starten Sie den Server durch Ausführen socket/run_server.bat und Sprache werden in socket/vts_speech.txt gesendet, wenn Sie die Sprache an Sprachstandort verwenden.

Bidirektionale Übersetzung

Dies ist eine Vorgehensweise, um ein benutzerdefiniertes System einzurichten, die bidirektionale Übersetzung zwischen Ihnen und jemand anderem ermöglicht.

Sie benötigen zwei Chrombrowser, die separat installiert sind. Ich empfehle Chrome und Chrome Beta. Dies liegt daran, dass ein einzelner Chrombrowser jeweils nur einen Spracheingang verarbeiten kann.
Sie benötigen auch mindestens zwei Audiorouter von VB-Cable. Sie sollten den Standard -VB-Cable-Treiber sowie einen zusätzlichen VB-Cable A-Treiber (Spendenware) erhalten. Dies ist so, dass wir Audio über separate Kanäle weiterleiten können, um Kollisionen der Spracherkennungsergebnisse zu vermeiden. Nach dem Einrichten können Sie die Tonoptionen Ihres Computers öffnen und das Hören der Kabel von Ihren Hauptlautsprechern ermöglichen. Dies hilft zu hören, was während des Gesprächs passiert.
Öffnen Sie die Stimme für die Sprache auf beiden Browsern. Öffnen Sie das Optionsmenü und aktivieren Sie die Übersetzung in beiden Browsern.
Stellen Sie in Chrom die Eingabe auf Ihr persönliches Mikrofon und die Ausgabe auf Kabelausgang ein. Stellen Sie dann Ihre Sprache als Eingabe und die Sprache ein, in der die andere Person als Ausgabe spricht.
Stellen Sie in Ihrem Kommunikationsprogramm Ihr Eingangsmikrofon auf Kabelausgang ein. Wenn Sie jetzt sprechen, wird die Sprachsynthese anstelle Ihrer Stimme in Ihr Kommunikationsprogramm ausgegeben.
Stellen Sie in Chrome Beta den Eingang auf das Kabel-A-Ausgang und die Ausgabe auf Ihren Standardlautsprecher ein. Stellen Sie dann die Sprache ein, in der die andere Person als Eingabe und Ihre Sprache als Ausgabe spricht.
Wenn Ihr Kommunikationsprogramm unterstützt, dass die Audioausgabe umgeleitet wird, stellen Sie die Ausgabe auf Kabel-A-Ausgabe ein. Wenn Sie Windows verwenden, können Sie in der App der Einstellungen zu Sound -Wiedergabeoptionen wechseln, auf App -Lautstärke und Geräteeigenschaften klicken und das Ausgabegerät für Ihr Kommunikationsprogramm ändern. Auf diese Weise müssen Sie Ihr Programm neu starten. Wenn die andere Person nun spricht, wird ihre Stimme durch Stimme zu Sprache und Ausgabe als übersetzter Sprache durch Ihren Sprecher umgeleitet.
Jetzt wird die Stimme der anderen Person automatisch übersetzt und mit Ihrem Sprecher gesprochen, und Ihre Stimme wird durch Ihr Kommunikationsprogramm automatisch übersetzt und gesprochen!