竊竊私語UI(現場翻譯/轉錄)Whispering Tiger UI是一種本地UI ,可用於控制竊竊私語的老虎應用。
Whispering Tiger是一種免費的開源工具,可以在計算機上收聽/觀看任何音頻流或遊戲中的圖像,並使用WebSocket或OSC打印到轉錄或翻譯為Web瀏覽器(示例是流式播放或VRCHAT )。

從“發行版”頁面下載最新版本。

視頻教程“竊竊私語 - 現場翻譯和轉錄”:

從[版本]下載最新版本後,將其提取到帶有足夠可用空間的驅動器上的您選擇的文件夾中。
(請勿直接從zip文件運行,不要從外部驅動器中運行。)
安裝CUDA以進行GPU加速度(可選,但建議用於NVIDIA GPU)。
運行Whispering Tiger.exe文件。
讓它下載最新版本的Whispering Tiger 。 (它將要求下載平台。)
下載完成後,您可以創建個人資料並開始使用Whispering Tiger應用程序。
通過輸入名稱並單擊新按鈕來創建個人資料。
Websocket IP + Port可以保持在默認值“ 127.0.0.1”和“ 5000”。
選擇您的音頻輸入和輸出設備。您可以通過向麥克風說話並單擊測試按鈕來測試它們。
說話時,您應該看到音頻輸入欄的移動。並在單擊測試按鈕時聽到測試原告,並查看音頻輸出欄。

有關特定音頻設置的更多信息,另請參見音頻配置(TTS到MIC,遊戲音頻翻譯等) 。
(例如,當您想翻譯在PC上播放的遊戲,視頻或流的音頻時,而不是使用麥克風作為輸入。) 。
(可選)使用推動來通話單擊字段,然後按要使用的鍵進行交談
(單獨按每個鍵進行配置。運行配置文件時,使用按下來交談時,將要求所有鍵同時按下)
Speech volume Level和Speech pause detection設置為0。密切注意右下角的估計內存消耗。
這只是一個粗略的估計,並且可能會有所不同,但是應該讓您了解所選AI模型所需的(v-)RAM的數量。和選項。

根據您的硬件選擇用於語音到文本和文本翻譯的AI設備。
選擇語音到文本的大小和文本翻譯大小。
選擇語音到文本的精度和文本翻譯精度
float16 。float32 , int16或int8精度。筆記:
- 您可以使用這些值,直到獲得所需的結果為止。
- 如果某件事不起作用,請檢查“高級”選項卡下的日誌。並檢查任何錯誤。
- 啟用寫日誌以將日誌保存到文件。
*.py文件並將其放在插件文件夾中。筆記:
大多數插件具有特定的設置,可以在插件選項卡中的插件的文本框中配置。
另請參見插件VoiceVox(日語TTS)的示例設置,例如如何設置VoiceVox插件。
為了獲得其他幫助,您可以加入
在不和諧的老虎小聲






