該腳本使用TTS(文本到語音)庫具有兩個不同的模型:XTTS v2.0.2和Tortoise。該腳本還包括一個用於將MP3文件轉換為分段WAV文件的實用程序功能。
在運行腳本之前,請確保使用以下命令安裝TTS庫:
pip install TTS==0.22.0 transformers==4.37.2 torch torchaudio soundfile librosa
python tortoise_TTS_local_best.py
XTTS v2.0.2合成:
mp3轉換
烏龜模型綜合描述:
XTTS v2.0.2的速度和合理質量建議。烏龜提供了最佳質量,但推理時間更長。
該腳本分析了TTS庫中可用的文本到語音(TTS)模型,特別關注其語言支持和Vocoder功能。它基於以下方式對模型進行分類:
該腳本還會跟踪具有錯誤的模型數量以及由於特定原因(例如,已知引起錯誤的模型)而忽略的腳本數量。
在運行腳本之前,請確保使用以下命令安裝TTS庫:
pip install TTS==0.13.3
python TTS_download_and_test_all_models.py
該腳本通過英語Vocoder生成有關多語言模型的信息,具有自定義聲音的英語模型,帶有默認英語Vocoders的多語言模型以及帶有默認英語Vocoders的英語模型。此外,它標識了支持非英語語言的模型,具有錯誤的模型以及應忽略的模型。
該腳本執行以下任務:
導入必要的庫(TTS,Time,OS)。
設置一個計時器來測量腳本執行時間。
定義用於語音合成的示例文本。
初始化各種模型類別的計數器和列表。
通過所有可用的TTS型號迭代。
下載並加載每個模型以執行不同的文本到語音任務,並根據語言支持和Vocoder類型對其進行分類。
打印結果,包括每個類別中模型的計數和名稱,以及過程中遇到的任何錯誤。
顯示已檢查的模型總數和腳本執行時間。
執行斷言檢查以確保正確計數模型。
提供了一個使用TTS與多演講者和多語言模型進行文本到語音的示例。
由於錯誤或其他原因(在代碼中指定)可能會忽略某些模型。該腳本還包括使用特定模型在Colab中希臘文本到語音的示例。
請隨意根據需要修改特定用例的腳本或將其集成到項目中以進行TTS模型分析。
該腳本演示了烏龜TTS(文本到語音)系統的用法來生成輸入文本的語音。腳本使用烏龜TTS庫,並提供安裝說明。生成的語音被保存為WAV文件。
git clone https://github.com/neonbjb/tortoise-tts.git
cd tortoise-tts
pip install -r requirements.txt
pip install librosa einops rotary_embedding_torch omegaconf pydub inflect
python setup.py installpython tortoise_API.py運行腳本以執行烏龜TTS,並將生成的語音保存為WAV文件。導入必要的庫:
初始化烏龜TT:
指定輸入文本:
選擇預設和聲音:
負載參考夾:
用烏龜進行TT:
該腳本促進了Opus Audio Files到MP3格式的轉換。它包括讀取opus文件,將其轉換為mp3,然後將多個MP3文件組合到單個文件中的功能。該腳本通過允許用戶指定輸入和輸出文件夾來提供靈活性。
opus_folder:包含Opus文件的文件夾的路徑。
mp3_output_folder:保存單個mp3文件的路徑。
combined_output_folder:保存組合MP3文件的路徑。
如果不存在,則腳本會創建輸出文件夾。
ossoundfilenumpy這本jupyter筆記本展示了使用樹皮語音克隆系統克隆語音的過程。它涉及安裝Google驅動器以訪問音頻樣本以進行克隆,安裝必要的庫,加載模型,生成語義令牌,最後使用這些令牌進行語音克隆。
安裝Google Drive:
設置參數:
安裝和導入庫:
用語音克隆安裝樹皮:
負載模型並初始化休伯特:
負載和過程音頻:
編碼並保存提示:
使用樹皮生成音頻:
播放並保存生成的音頻:
總運行時間:
audio_filepath , voice_name和output_path 。該腳本展示了使用Coqui TTS API克隆語音的過程。它涉及導入必要的庫,進行API調用,從音頻文件中克隆語音,並使用克隆語音生成文本到語音。
導入庫:
requests 。設置參數:
致電Coqui TTS API進行語音克隆:
致電Coqui TTS API進行文本到語音:
下載並保存音頻:
path_audio )的路徑,保存新音頻文件( save_path )的路徑以及要讀取的文本( text_to_read )。headers中替換佔位符。save_path中指定的本地保存。