窃窃私语UI(现场翻译/转录)Whispering Tiger UI是一种本地UI ,可用于控制窃窃私语的老虎应用。
Whispering Tiger是一种免费的开源工具,可以在计算机上收听/观看任何音频流或游戏中的图像,并使用WebSocket或OSC打印到转录或翻译为Web浏览器(示例是流式播放或VRCHAT )。

从“发行版”页面下载最新版本。

视频教程“窃窃私语 - 现场翻译和转录”:

从[版本]下载最新版本后,将其提取到带有足够可用空间的驱动器上的您选择的文件夹中。
(请勿直接从zip文件运行,不要从外部驱动器中运行。)
安装CUDA以进行GPU加速度(可选,但建议用于NVIDIA GPU)。
运行Whispering Tiger.exe文件。
让它下载最新版本的Whispering Tiger 。 (它将要求下载平台。)
下载完成后,您可以创建个人资料并开始使用Whispering Tiger应用程序。
通过输入名称并单击新按钮来创建个人资料。
Websocket IP + Port可以保持在默认值“ 127.0.0.1”和“ 5000”。
选择您的音频输入和输出设备。您可以通过向麦克风说话并单击测试按钮来测试它们。
说话时,您应该看到音频输入栏的移动。并在单击测试按钮时听到测试原告,并查看音频输出栏。

有关特定音频设置的更多信息,另请参见音频配置(TTS到MIC,游戏音频翻译等) 。
(例如,当您想翻译在PC上播放的游戏,视频或流的音频时,而不是使用麦克风作为输入。) 。
(可选)使用推动来通话单击字段,然后按要使用的键进行交谈
(单独按每个键进行配置。运行配置文件时,使用按下来交谈时,将要求所有键同时按下)
Speech volume Level和Speech pause detection设置为0。密切注意右下角的估计内存消耗。
这只是一个粗略的估计,并且可能会有所不同,但是应该让您了解所选AI模型所需的(v-)RAM的数量。和选项。

根据您的硬件选择用于语音到文本和文本翻译的AI设备。
选择语音到文本的大小和文本翻译大小。
选择语音到文本的精度和文本翻译精度
float16 。float32 , int16或int8精度。笔记:
- 您可以使用这些值,直到获得所需的结果为止。
- 如果某件事不起作用,请检查“高级”选项卡下的日志。并检查任何错误。
- 启用写日志以将日志保存到文件。
*.py文件并将其放在插件文件夹中。笔记:
大多数插件具有特定的设置,可以在插件选项卡中的插件的文本框中配置。
另请参见插件VoiceVox(日语TTS)的示例设置,例如如何设置VoiceVox插件。
为了获得其他帮助,您可以加入
在不和谐的老虎小声






