
用以下命令克隆存储库
git clone --recursive https://github.com/balisujohn/tortoise.cpp.git
目前,CUDA和CPU。编译:
mkdir build
cd build
cmake ..
make
这是用Mac OS臂测试的
mkdir build
cd build
cmake .. -DGGML_CUBLAS=ON
make
这是用Ubuntu 22.04和Cuda 12.0和1070TI测试的
mkdir build
cd build
cmake .. -DGGML_METAL=ON
make
在提示中仅支持小写字母,空间和标点符号。
您需要将ggml-model.bin , ggml-vocoder-model.bin和ggml-diffusion-model.bin放置在模型目录中以运行tortoise.cpp。您可以在此处下载https://huggingface.co/balisujohn/tortoise-ggml。我将释放用于从龟-TT生成这些文件的脚本。
从构建目录中,运行:
./tortoise
这是一个应该解决的示例:
./tortoise --message "based... dr freeman?" --voice "../models/mouse.bin" --seed 0 --output "based?.wav"
所有命令行参数都是可选的:
arguments:
--message Specifies the message to generate, lowercase letters, spaces, and punctuation only. (default: "this is a test message." )
--voice Specifies the path to the voice file to use to determine the speaker's voice. (default: "../models/mol.bin" )
--output Specifies the path where the generated wav file will be saved. (default: "./output.wav")
--seed Specifies the seed for psuedorandom number generation, used in autoregressive sampling and diffusion sampling (default: system time seed)
set up the original tortoise-tts, then run it with whatever voice you have, then after this line: https://github.com/neonbjb/tortoise-tts/blob/e2d9fba0bb5c4376d0d142efea47a448f97c4d90/tortoise/api.py#L401
添加此代码:
numpy_array = auto_conditioning.to("cpu").numpy().astype(np.float32) # Ensure float32 for binary format
# Define the file path
file_path = 'auto_conditioning.bin'
# Save NumPy array as binary file
numpy_array.tofile(file_path)
print("saved auto conditioning")
exit()
然后,您可以将auto_conditioning.bin重命名为扬声器名称,然后将文件放入模型文件夹中以像其他任何语音一样使用它。这与tortoise-tts声音一起使用。
如果您想做出贡献,请提出一个问题,说明您想做什么。如果您想要一个链接加入Dev Discord,或者您有疑问,请在Twitter上DM我。我很高兴帮助人们开始贡献!
我还提供了一大堆乌龟,它具有我的反向工程注释,也可以提供自回归模型的导出脚本。
这是通过MIT许可发布的。
麻省理工学院许可证
版权(C)2024 John Balis
特此免费授予获得此软件副本和相关文档文件副本(“软件”)的任何人,以无限制处理该软件,包括无限制的使用权,复制,复制,修改,合并,合并,发布,分发,分发,分发,订婚,和/或允许软件的副本,并允许对以下条件提供以下条件,以下是以下条件。
上述版权通知和此许可通知应包含在软件的所有副本或大量部分中。
该软件是“原样”提供的,没有任何形式的明示或暗示保证,包括但不限于适销性,特定目的的适用性和非侵权的保证。在任何情况下,作者或版权持有人都不应对任何索赔,损害赔偿或其他责任责任,无论是在合同,侵权的诉讼中还是其他责任,是由软件,使用或与软件中的使用或其他交易有关的。
源自乌龟-TT和GGML。
Apache 2.0许可证詹姆斯·贝克(James Betker)
麻省理工学院许可证
版权(C)2022 Georgi Gerganov
特此免费授予获得此软件副本和相关文档文件副本(“软件”)的任何人,以无限制处理该软件,包括无限制的使用权,复制,复制,修改,合并,合并,发布,分发,分发,分发,订婚,和/或允许软件的副本,并允许对以下条件提供以下条件,以下是以下条件。
上述版权通知和此许可通知应包含在软件的所有副本或大量部分中。
该软件是“原样”提供的,没有任何形式的明示或暗示保证,包括但不限于适销性,特定目的的适用性和非侵权的保证。在任何情况下,作者或版权持有人都不应对任何索赔,损害赔偿或其他责任责任,无论是在合同,侵权的诉讼中还是其他责任,是由软件,使用或与软件中的使用或其他交易有关的。