TTS dataset tools下載TTS dataset tools源代碼下載

TTS dataset tools

Ai源碼

1.0.0

下載

tts-dataset-tools

通過Google語音轉錄音頻，並通過揚聲器分離（診斷）轉錄文本API。使用音頻和關聯的文本自動生成TTS數據集。使用Google API來轉錄已按最大沉默中斷（建議）分開的切割。或使用EENEAS強制將文本對齊音頻。快速校對和編輯切割。

對於Google對文本API的演講，您將需要一個Google Cloud Platform帳戶。您的$ Google_application_credentials env變量必須指向您的憑據JSON文件路徑。 Google在新帳戶上免費提供300美元的服務和3個月的免費服務。

運行Tools.py用於GUI工具。

當前的限制是您需要調整校對部分的列寬度，並且在導航條目時，必須將焦點從當前和下一個輸入文本框中取下，或者文本框將無法更新。 Dearpy Gui的下一個版本將解決這些問題。

使用VPN會干擾長長的Google語音來文本API請求。

GUI數據集

在媽媽們使用舊版本的Dearpygui，我最終將遷移。

Windows設置

pip安裝numpy-用戶

PIP安裝pydub - 用戶

pip安裝dearpygui == 0.6.415-用戶

PIP安裝Google-Cloud語音 - 用戶

PIP安裝Google-Cloud-Storagory - 用戶

PIP安裝SimpleAudio-用戶

*如果您無法構建SimpereAudio，請確保安裝了GCC：Sudo Apt-GET更新，Sudo Apt-get install build-esentersentss

PIP安裝Sox-用戶

Linux設置

建議使用Linux環境，以適用於AENEAS選項，在Windows aeneas中，由於內存問題，將無法進行更長的削減。

WGET https://raw.githubusercontent.com/readbeyond/aeneas/master/install_depperencies.sh

bash install_dependencies.sh

pip安裝numpy-用戶

PIP安裝埃涅阿斯 - 用戶

測試安裝：python -m aeneas.diarostics

PIP安裝pydub - 用戶

pip安裝dearpygui == 0.6.415-用戶

PIP安裝Google-Cloud語音 - 用戶

PIP安裝Google-Cloud-Storagory - 用戶

PIP安裝SimpleAudio-用戶

PIP安裝Sox-用戶

如果您遇到Libpython錯誤：

sudo apt install libasound2-dev

通過鍵入：sudo nano〜/.bashrc編輯bashrc文件

然後，根據您的包裝的安裝在何處，並在結尾處添加該行：

導出ld_library_path =“/[yourhomepath]/anaconda3/envs/[yourenv]/lib/“”

或者

導出ld_library_path =“/[yourhomepath]/。conda/envs/[yourenv]/lib/'

或者如果基本環境

導出ld_library_path =“/[yourhomepath]/anaconda3/lib/'

按CTRL+O導出更新的文件。然後ctrl+x退出。

鍵入源〜/.bashrc啟用新路徑。

用法

視頻教程：https：//www.youtube.com/watch?v=te7pui2xeje

建議

儘管您應該始終在培訓前校對它們，但有幾件事將提高您的削減質量。對於英語以外的其他語言，您可以輕鬆地編輯AENEAS命令行和字符替換為您的需求，並用您的語言代碼（https://cloud.google.com/speech-toece-toxt-text/docs/languages）替換Google en-us語言代碼。檢查是否包括章節標題之類的內容。發言緩慢甚至節奏的揚聲器將使最乾淨的剪輯削減，而快節奏的揚聲器傾向於一起運行單詞，並可能導致一些單詞，單詞，將其轉移到下一個必須進行編輯的切割中。如果可以的話，請刪除所有音樂。

展開

附加信息

版本 1.0.0
類型 Ai源碼
更新時間 2025-09-15
大小 430.01KB
來自於 Github

相關應用

language tools

2024-11-11
glaucoma dataset metadata

2024-11-09
ffhq wrinkle dataset

2024-11-07
biliLive tools

2024-11-03
F5 TTS ComfyUI

2024-11-02
sra tools

2024-11-01

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
ML stack

Ai源碼

1.0.0
awesome free chatgpt

Ai源碼

1.0.0
pywin_contextmenu

Ai源碼

Version update
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源碼

v1.1.0-rc-3

相關資訊全部