通過Google語音轉錄音頻,並通過揚聲器分離(診斷)轉錄文本API。使用音頻和關聯的文本自動生成TTS數據集。使用Google API來轉錄已按最大沉默中斷(建議)分開的切割。或使用EENEAS強制將文本對齊音頻。快速校對和編輯切割。
對於Google對文本API的演講,您將需要一個Google Cloud Platform帳戶。您的$ Google_application_credentials env變量必須指向您的憑據JSON文件路徑。 Google在新帳戶上免費提供300美元的服務和3個月的免費服務。
運行Tools.py用於GUI工具。
當前的限制是您需要調整校對部分的列寬度,並且在導航條目時,必須將焦點從當前和下一個輸入文本框中取下,或者文本框將無法更新。 Dearpy Gui的下一個版本將解決這些問題。
使用VPN會干擾長長的Google語音來文本API請求。


在媽媽們使用舊版本的Dearpygui,我最終將遷移。
pip安裝numpy-用戶
PIP安裝pydub - 用戶
pip安裝dearpygui == 0.6.415-用戶
PIP安裝Google-Cloud語音 - 用戶
PIP安裝Google-Cloud-Storagory - 用戶
PIP安裝SimpleAudio-用戶
*如果您無法構建SimpereAudio,請確保安裝了GCC:Sudo Apt-GET更新,Sudo Apt-get install build-esentersentss
PIP安裝Sox-用戶
建議使用Linux環境,以適用於AENEAS選項,在Windows aeneas中,由於內存問題,將無法進行更長的削減。
WGET https://raw.githubusercontent.com/readbeyond/aeneas/master/install_depperencies.sh
bash install_dependencies.sh
pip安裝numpy-用戶
PIP安裝埃涅阿斯 - 用戶
測試安裝:python -m aeneas.diarostics
PIP安裝pydub - 用戶
pip安裝dearpygui == 0.6.415-用戶
PIP安裝Google-Cloud語音 - 用戶
PIP安裝Google-Cloud-Storagory - 用戶
PIP安裝SimpleAudio-用戶
PIP安裝Sox-用戶
如果您遇到Libpython錯誤:
sudo apt install libasound2-dev
通過鍵入:sudo nano〜/.bashrc編輯bashrc文件
然後,根據您的包裝的安裝在何處,並在結尾處添加該行:
導出ld_library_path =“/[yourhomepath]/anaconda3/envs/[yourenv]/lib/“”
或者
導出ld_library_path =“/[yourhomepath]/。conda/envs/[yourenv]/lib/'
或者如果基本環境
導出ld_library_path =“/[yourhomepath]/anaconda3/lib/'
按CTRL+O導出更新的文件。然後ctrl+x退出。
鍵入源〜/.bashrc啟用新路徑。
視頻教程:https://www.youtube.com/watch?v=te7pui2xeje
儘管您應該始終在培訓前校對它們,但有幾件事將提高您的削減質量。對於英語以外的其他語言,您可以輕鬆地編輯AENEAS命令行和字符替換為您的需求,並用您的語言代碼(https://cloud.google.com/speech-toece-toxt-text/docs/languages)替換Google en-us語言代碼。檢查是否包括章節標題之類的內容。發言緩慢甚至節奏的揚聲器將使最乾淨的剪輯削減,而快節奏的揚聲器傾向於一起運行單詞,並可能導致一些單詞,單詞,將其轉移到下一個必須進行編輯的切割中。如果可以的話,請刪除所有音樂。