声からスピーチ
Voice to Speechは、数百の音声、テキスト、スピーチ(TTS)、言語自動翻訳、ソケットサポートを介して、ユーザーの音声を合成されたスピーチにライブに変換するブラウザー内のクライアント側サービスです。
既知のサポートされているブラウザ:Chrome、Edge、Safari
https://shadowforests.github.io/voicetospeech/にアクセスして、音声から音声を使用してください。
特徴
- Web Speech API(Chromeのみ)を介したライブ音声認識。
- 暫定的な音声認識結果を使用して、低遅延音声からスピーチ。
- 出力の微細な制御のための代替テキストからスピーチへの入力。
- 入力音声言語から出力音声言語への自動翻訳。
- 音声認識と声のための言語と方言の幅広い選択。
- コンピューターでの声のサポートが含まれており、ブラウザに組み込まれています。
- オーディオ入力および出力デバイスをカスタマイズします。
- 出力ボリュームをカスタマイズし、選択した声のピッチとレートをカスタマイズします。
- すべてのトランスクリプトエントリの再生サポートを備えたライブ音声出力トランスクリプト。
- ページ上のすべてのテキストを選択すると、トランスクリプトテキストのみが選択され、簡単なコピーパストが可能になります。
- 音声認識出力、自信、およびエラーのライブ診断。
- Webソケットを使用して、音声出力テキストをPCに直接送信します。
- 2つのインスタンスを使用して、あなたと他の誰かの間の双方向の翻訳を許可します。
Webソケット
PCにWeb Socket Serverを設定して、PCに直接音声出力テキストを送信できます。このリポジトリに、ノードを使用して実行できる例を見つけることができます。 socket/run_server.batを実行してサーバーを起動し、音声からスピーチサイトを使用するたびにsocket/vts_speech.txtにスピーチが送信されます。
双方向翻訳
これは、カスタムシステムをセットアップするためのウォークスルーで、あなたと他の誰かの間の双方向の翻訳を可能にします。
- 2つのChromeブラウザが個別にインストールされる必要があります。 ChromeとChromeベータ版をお勧めします。これは、単一のChromeブラウザが一度に1つの音声入力のみを処理できるためです。
- また、VBケーブルから少なくとも2つのオーディオルーターが必要です。デフォルトのVBケーブルドライバーと追加のVBケーブルAドライバー(寄付ウェア)を取得する必要があります。これは、音声認識結果の衝突を避けるために、個別のチャネルを通じてオーディオをルーティングできるようにするためです。セットアップ後、コンピューターのサウンドオプションを開き、メインスピーカーからケーブルを聴くことができます。これは、会話中に何が起こっているかを聞くのに役立ちます。
- 両方のブラウザで音声をスピーチサイトに開きます。オプションメニューを開き、両方のブラウザで翻訳を有効にします。
- Chromeで、個人マイクに入力を設定し、出力をケーブル出力に設定します。次に、あなたの言語を入力として、そして他の人が話す言語を出力として設定します。
- 通信プログラムでは、入力マイクをケーブル出力に設定します。今、あなたが話すとき、音声統合はあなたの声の代わりにあなたのコミュニケーションプログラムに出力されます。
- Chromeベータで、入力をケーブルA出力に設定し、出力をデフォルトスピーカーに設定します。次に、他の人が話す言語を入力として、言語を出力として設定します。
- 通信プログラムがオーディオ出力のリダイレクトをサポートしている場合、出力をケーブルA出力に設定します。それ以外の場合、Windowsを使用している場合は、SettingsアプリのSound Playbackオプションに移動し、アプリのボリュームとデバイスプロパティをクリックし、通信プログラムの出力デバイスを変更できます。これには、プログラムを再起動する必要がある場合があります。さて、他の人が話すとき、彼らの声は、あなたのスピーカーを通して翻訳されたスピーチとして音声から音声までリダイレクトされます。
- これで、他の人の声が自動翻訳され、スピーカーに話しかけられ、あなたの声は自動翻訳され、コミュニケーションプログラムを通じて話されます!
ライセンス
このプロジェクトはMITライセンスに基づいてライセンスされています - 詳細については、license.mdファイルを参照してください