
用以下命令克隆存儲庫
git clone --recursive https://github.com/balisujohn/tortoise.cpp.git
目前,CUDA和CPU。編譯:
mkdir build
cd build
cmake ..
make
這是用Mac OS臂測試的
mkdir build
cd build
cmake .. -DGGML_CUBLAS=ON
make
這是用Ubuntu 22.04和Cuda 12.0和1070TI測試的
mkdir build
cd build
cmake .. -DGGML_METAL=ON
make
在提示中僅支持小寫字母,空間和標點符號。
您需要將ggml-model.bin , ggml-vocoder-model.bin和ggml-diffusion-model.bin放置在模型目錄中以運行tortoise.cpp。您可以在此處下載https://huggingface.co/balisujohn/tortoise-ggml。我將釋放用於從龜-TT生成這些文件的腳本。
從構建目錄中,運行:
./tortoise
這是一個應該解決的示例:
./tortoise --message "based... dr freeman?" --voice "../models/mouse.bin" --seed 0 --output "based?.wav"
所有命令行參數都是可選的:
arguments:
--message Specifies the message to generate, lowercase letters, spaces, and punctuation only. (default: "this is a test message." )
--voice Specifies the path to the voice file to use to determine the speaker's voice. (default: "../models/mol.bin" )
--output Specifies the path where the generated wav file will be saved. (default: "./output.wav")
--seed Specifies the seed for psuedorandom number generation, used in autoregressive sampling and diffusion sampling (default: system time seed)
set up the original tortoise-tts, then run it with whatever voice you have, then after this line: https://github.com/neonbjb/tortoise-tts/blob/e2d9fba0bb5c4376d0d142efea47a448f97c4d90/tortoise/api.py#L401
添加此代碼:
numpy_array = auto_conditioning.to("cpu").numpy().astype(np.float32) # Ensure float32 for binary format
# Define the file path
file_path = 'auto_conditioning.bin'
# Save NumPy array as binary file
numpy_array.tofile(file_path)
print("saved auto conditioning")
exit()
然後,您可以將auto_conditioning.bin重命名為揚聲器名稱,然後將文件放入模型文件夾中以像其他任何語音一樣使用它。這與tortoise-tts聲音一起使用。
如果您想做出貢獻,請提出一個問題,說明您想做什麼。如果您想要一個鏈接加入Dev Discord,或者您有疑問,請在Twitter上DM我。我很高興幫助人們開始貢獻!
我還提供了一大堆烏龜,它具有我的反向工程註釋,也可以提供自回歸模型的導出腳本。
這是通過MIT許可發布的。
麻省理工學院許可證
版權(C)2024 John Balis
特此免費授予獲得此軟件副本和相關文檔文件副本(“軟件”)的任何人,以無限制處理該軟件,包括無限制的使用權,複製,複製,修改,合併,合併,發布,分發,分發,分發,訂婚,和/或允許軟件的副本,並允許對以下條件提供以下條件,以下是以下條件。
上述版權通知和此許可通知應包含在軟件的所有副本或大量部分中。
該軟件是“原樣”提供的,沒有任何形式的明示或暗示保證,包括但不限於適銷性,特定目的的適用性和非侵權的保證。在任何情況下,作者或版權持有人都不應對任何索賠,損害賠償或其他責任責任,無論是在合同,侵權的訴訟中還是其他責任,是由軟件,使用或與軟件中的使用或其他交易有關的。
源自烏龜-TT和GGML。
Apache 2.0許可證詹姆斯·貝克(James Betker)
麻省理工學院許可證
版權(C)2022 Georgi Gerganov
特此免費授予獲得此軟件副本和相關文檔文件副本(“軟件”)的任何人,以無限制處理該軟件,包括無限制的使用權,複製,複製,修改,合併,合併,發布,分發,分發,分發,訂婚,和/或允許軟件的副本,並允許對以下條件提供以下條件,以下是以下條件。
上述版權通知和此許可通知應包含在軟件的所有副本或大量部分中。
該軟件是“原樣”提供的,沒有任何形式的明示或暗示保證,包括但不限於適銷性,特定目的的適用性和非侵權的保證。在任何情況下,作者或版權持有人都不應對任何索賠,損害賠償或其他責任責任,無論是在合同,侵權的訴訟中還是其他責任,是由軟件,使用或與軟件中的使用或其他交易有關的。