語音的聲音
語音到語音是瀏覽器內的客戶端服務,它通過語音識別將用戶的聲音轉換為綜合語音,具有數百個聲音,文本到語音(TTS),語言自動翻譯和插座支持。
已知的支持瀏覽器:鉻,邊緣,野生動物園
請訪問https://shadowforests.github.io/voicetospeech/使用語音進行語音。
特徵
- 通過網絡語音API(僅在Chrome上)實時語音識別。
- 通過使用臨時語音識別結果,低延遲語音到語音。
- 替代文本對語音輸入,以精細控制輸出。
- 自動翻譯從輸入語音語言到輸出語音語言。
- 大量的語言和方言,用於語音識別和聲音。
- 包括對計算機上的聲音的支持,並內置在瀏覽器中。
- 自定義音頻輸入和輸出設備。
- 自定義輸出音量,以及選定聲音的音高和速率。
- 實時語音輸出成績單,並為所有成績單條目提供播放支持。
- 選擇頁面上的所有文本只會選擇成績單文本,允許輕鬆複製。
- 語音識別輸出,信心和錯誤的實時診斷。
- 使用Web插座將語音輸出文本直接發送到您的PC。
- 使用兩個實例允許您與其他人之間的雙向翻譯。
Web插座
您可以在PC上設置Web插座服務器,以將語音輸出文本直接發送到PC。您可以在此存儲庫中找到一個可以使用節點運行的示例。通過運行socket/run_server.bat啟動服務器,每當您使用語音到語音站點時,語音將發送到socket/vts_speech.txt 。
雙向翻譯
這是設置自定義系統的演練,允許您與其他人之間的雙向翻譯。
- 您將需要單獨安裝兩個鍍鉻瀏覽器。我推薦Chrome和Chrome Beta。這是因為一次鍍鉻瀏覽器一次只能處理一個語音輸入。
- 您還需要至少來自VB-Cable的兩個音頻路由器。您應該獲得默認的VB-Cable驅動程序以及其他VB-Cable驅動程序(捐贈軟件)。這樣我們就可以通過單獨的頻道路由音頻,以避免語音識別結果中的碰撞。設置後,您可以打開計算機的聲音選項,並啟用主揚聲器的電纜。這有助於聽到談話過程中正在發生的事情。
- 在兩個瀏覽器上打開語音到語音網站。打開選項菜單,並在兩個瀏覽器中啟用翻譯。
- 在Chrome中,將輸入設置為您的個人麥克風,並將輸出輸出為電纜輸出。然後,將您的語言設置為輸入,以及另一個人說的語言作為輸出。
- 在您的通信程序中,將輸入麥克風設置為電纜輸出。現在,當您講話時,語音綜合將輸出到您的通信程序而不是您的聲音。
- 在Chrome Beta中,將輸入設置為電纜A輸出,然後將輸出設置為默認揚聲器。然後,將對方說的語言設置為輸入,而您的語言則為輸出。
- 如果您的通信程序支持重定向音頻輸出,請將輸出設置為電纜A輸出。否則,如果您使用的是Windows,則可以在“設置應用程序”中使用Sound播放選項,單擊應用程序捲和設備屬性,然後更改通信程序的輸出設備。這可能需要您重新啟動程序。現在,當另一個人說話時,他們的聲音將通過語音和輸出作為通過您的演講者翻譯而來的語音和輸出來重定向。
- 現在,對方的聲音將自動翻譯和與您的演講者交談,您的聲音將通過您的通信程序自動翻譯和說話!
執照
該項目已根據MIT許可證獲得許可 - 有關詳細信息,請參見許可證文件。