语音的声音
语音到语音是浏览器内的客户端服务,它通过语音识别将用户的声音转换为综合语音,具有数百个声音,文本到语音(TTS),语言自动翻译和插座支持。
已知的支持浏览器:铬,边缘,野生动物园
请访问https://shadowforests.github.io/voicetospeech/使用语音进行语音。
特征
- 通过网络语音API(仅在Chrome上)实时语音识别。
- 通过使用临时语音识别结果,低延迟语音到语音。
- 替代文本对语音输入,以精细控制输出。
- 自动翻译从输入语音语言到输出语音语言。
- 大量的语言和方言,用于语音识别和声音。
- 包括对计算机上的声音的支持,并内置在浏览器中。
- 自定义音频输入和输出设备。
- 自定义输出音量,以及选定声音的音高和速率。
- 实时语音输出成绩单,并为所有成绩单条目提供播放支持。
- 选择页面上的所有文本只会选择成绩单文本,允许轻松复制。
- 语音识别输出,信心和错误的实时诊断。
- 使用Web插座将语音输出文本直接发送到您的PC。
- 使用两个实例允许您与其他人之间的双向翻译。
Web插座
您可以在PC上设置Web插座服务器,以将语音输出文本直接发送到PC。您可以在此存储库中找到一个可以使用节点运行的示例。通过运行socket/run_server.bat启动服务器,每当您使用语音到语音站点时,语音将发送到socket/vts_speech.txt 。
双向翻译
这是设置自定义系统的演练,允许您与其他人之间的双向翻译。
- 您将需要单独安装两个镀铬浏览器。我推荐Chrome和Chrome Beta。这是因为一次镀铬浏览器一次只能处理一个语音输入。
- 您还需要至少来自VB-Cable的两个音频路由器。您应该获得默认的VB-Cable驱动程序以及其他VB-Cable驱动程序(捐赠软件)。这样我们就可以通过单独的频道路由音频,以避免语音识别结果中的碰撞。设置后,您可以打开计算机的声音选项,并启用主扬声器的电缆。这有助于听到谈话过程中正在发生的事情。
- 在两个浏览器上打开语音到语音网站。打开选项菜单,并在两个浏览器中启用翻译。
- 在Chrome中,将输入设置为您的个人麦克风,并将输出输出为电缆输出。然后,将您的语言设置为输入,以及另一个人说的语言作为输出。
- 在您的通信程序中,将输入麦克风设置为电缆输出。现在,当您讲话时,语音综合将输出到您的通信程序而不是您的声音。
- 在Chrome Beta中,将输入设置为电缆A输出,然后将输出设置为默认扬声器。然后,将对方说的语言设置为输入,而您的语言则为输出。
- 如果您的通信程序支持重定向音频输出,请将输出设置为电缆A输出。否则,如果您使用的是Windows,则可以在“设置应用程序”中使用Sound播放选项,单击应用程序卷和设备属性,然后更改通信程序的输出设备。这可能需要您重新启动程序。现在,当另一个人说话时,他们的声音将通过语音和输出作为通过您的演讲者翻译而来的语音和输出来重定向。
- 现在,对方的声音将自动翻译和与您的演讲者交谈,您的声音将通过您的通信程序自动翻译和说话!
执照
该项目已根据MIT许可证获得许可 - 有关详细信息,请参见许可证文件。