
次のコマンドでリポジトリをクローンします
git clone --recursive https://github.com/balisujohn/tortoise.cpp.git
今のところ、CUDAとCPUのみ。コンパイルするには:
mkdir build
cd build
cmake ..
make
これは、Mac OSアームでテストされています
mkdir build
cd build
cmake .. -DGGML_CUBLAS=ON
make
これは、ubuntu 22.04およびcuda 12.0、および1070tiでテストされています
mkdir build
cd build
cmake .. -DGGML_METAL=ON
make
プロンプトでは、小文字、スペース、および句読点のみがサポートされています。
ggml-model.bin 、 ggml-vocoder-model.bin 、 ggml-diffusion-model.binモデルディレクトリに配置する必要があります。ここからhttps://huggingface.co/balisujohn/tortoise-ggmlをダウンロードできます。 Tortoise-TTSからこれらのファイルを生成するためのスクリプトをリリースします。
ビルドディレクトリから、実行してください。
./tortoise
これが箱から出して作業する必要がある例です。
./tortoise --message "based... dr freeman?" --voice "../models/mouse.bin" --seed 0 --output "based?.wav"
すべてのコマンドライン引数はオプションです。
arguments:
--message Specifies the message to generate, lowercase letters, spaces, and punctuation only. (default: "this is a test message." )
--voice Specifies the path to the voice file to use to determine the speaker's voice. (default: "../models/mol.bin" )
--output Specifies the path where the generated wav file will be saved. (default: "./output.wav")
--seed Specifies the seed for psuedorandom number generation, used in autoregressive sampling and diffusion sampling (default: system time seed)
set up the original tortoise-tts, then run it with whatever voice you have, then after this line: https://github.com/neonbjb/tortoise-tts/blob/e2d9fba0bb5c4376d0d142efea47a448f97c4d90/tortoise/api.py#L401
このコードを追加します:
numpy_array = auto_conditioning.to("cpu").numpy().astype(np.float32) # Ensure float32 for binary format
# Define the file path
file_path = 'auto_conditioning.bin'
# Save NumPy array as binary file
numpy_array.tofile(file_path)
print("saved auto conditioning")
exit()
次に、 auto_conditioning.binスピーカー名に変更し、モデルフォルダーにファイルを配置して、他の音声と同じように使用できます。これはtortoise-ttsを使用したVoices Cloneで動作します。
貢献したい場合は、何に取り組みたいかを述べている問題をお勧めします。リンクがDev Discordに参加したい場合、または質問がある場合は、TwitterでDM Me。人々が貢献を始めさせるのを手伝ってくれてうれしいです!
また、リバースエンジニアリングの注釈を備えたカメTTSのフォークと、自己回帰モデルのエクスポートスクリプトを利用できるようにしています。
これはMITライセンスでリリースされます。
MITライセンス
著作権(c)2024ジョン・バリ
このソフトウェアと関連するドキュメントファイル(「ソフトウェア」)のコピーを入手して、制限なしにソフトウェアを扱うために、このソフトウェアを制限する権利を含め、ソフトウェアのコピーをコピー、変更、公開、配布、販売する、ソフトウェアのコピーを許可する人を許可する人を許可することを含めて、許可が無料で許可されます。
上記の著作権通知とこの許可通知は、ソフトウェアのすべてのコピーまたはかなりの部分に含まれるものとします。
このソフトウェアは、商品性、特定の目的への適合性、および非侵害の保証を含むがこれらに限定されない、明示的または黙示的なものを保証することなく、「現状のまま」提供されます。いかなる場合でも、著者または著作権所有者は、契約、不法行為、またはその他の訴訟、ソフトウェアまたはソフトウェアの使用またはその他の取引に関連する、またはその他の契約、またはその他の請求、またはその他の責任について責任を負いません。
Tortoise-TTSおよびGGMLに由来します。
Apache 2.0ライセンスJames Betker https://github.com/neonbjb/tortoise-tts/blob/main/license
MITライセンス
著作権(c)2022 Georgi Gerganov
このソフトウェアと関連するドキュメントファイル(「ソフトウェア」)のコピーを入手して、制限なしにソフトウェアを扱うために、このソフトウェアを制限する権利を含め、ソフトウェアのコピーをコピー、変更、公開、配布、販売する、ソフトウェアのコピーを許可する人を許可する人を許可することを含めて、許可が無料で許可されます。
上記の著作権通知とこの許可通知は、ソフトウェアのすべてのコピーまたはかなりの部分に含まれるものとします。
このソフトウェアは、商品性、特定の目的への適合性、および非侵害の保証を含むがこれらに限定されない、明示的または黙示的なものを保証することなく、「現状のまま」提供されます。いかなる場合でも、著者または著作権所有者は、契約、不法行為、またはその他の訴訟、ソフトウェアまたはソフトウェアの使用またはその他の取引に関連する、またはその他の契約、またはその他の請求、またはその他の責任について責任を負いません。