
โคลนที่เก็บด้วยคำสั่งต่อไปนี้
git clone --recursive https://github.com/balisujohn/tortoise.cpp.git
สำหรับตอนนี้ CUDA และ CPU เท่านั้น เพื่อรวบรวม:
mkdir build
cd build
cmake ..
make
นี่คือการทดสอบด้วยแขน Mac OS
mkdir build
cd build
cmake .. -DGGML_CUBLAS=ON
make
นี่คือการทดสอบกับ Ubuntu 22.04 และ Cuda 12.0 และ 1070ti
mkdir build
cd build
cmake .. -DGGML_METAL=ON
make
รองรับตัวอักษรตัวพิมพ์เล็กช่องว่างและเครื่องหมายวรรคตอนเท่านั้นในพรอมต์
คุณจะต้องวาง ggml-model.bin , ggml-vocoder-model.bin และ ggml-diffusion-model.bin ในไดเรกทอรีโมเดลเพื่อเรียกใช้ tortoise.cpp คุณสามารถดาวน์โหลดได้ที่นี่ https://huggingface.co/balisujohn/tortoise-ggml ฉันจะปล่อยสคริปต์สำหรับการสร้างไฟล์เหล่านี้จาก Tortoise-TTS
จากไดเรกทอรี Build, Run:
./tortoise
นี่คือตัวอย่างที่ควรทำงานนอกกรอบ:
./tortoise --message "based... dr freeman?" --voice "../models/mouse.bin" --seed 0 --output "based?.wav"
อาร์กิวเมนต์บรรทัดคำสั่งทั้งหมดเป็นทางเลือก:
arguments:
--message Specifies the message to generate, lowercase letters, spaces, and punctuation only. (default: "this is a test message." )
--voice Specifies the path to the voice file to use to determine the speaker's voice. (default: "../models/mol.bin" )
--output Specifies the path where the generated wav file will be saved. (default: "./output.wav")
--seed Specifies the seed for psuedorandom number generation, used in autoregressive sampling and diffusion sampling (default: system time seed)
ตั้งค่า Tortoise-tts ดั้งเดิมจากนั้นเรียกใช้ด้วยเสียงใด ๆ ที่คุณมีหลังจากนั้น: https://github.com/neonbjb/tortoise-tts/blob/e2d9fba0bb5c4376d0d142efea47a448f97c4d90/tortoise
เพิ่มรหัสนี้:
numpy_array = auto_conditioning.to("cpu").numpy().astype(np.float32) # Ensure float32 for binary format
# Define the file path
file_path = 'auto_conditioning.bin'
# Save NumPy array as binary file
numpy_array.tofile(file_path)
print("saved auto conditioning")
exit()
จากนั้นคุณสามารถเปลี่ยนชื่อ auto_conditioning.bin ไปยังชื่อลำโพงและใส่ไฟล์ในโฟลเดอร์โมเดลของคุณเพื่อใช้งานเช่นเสียงอื่น ๆ สิ่งนี้ใช้งานได้กับเสียงโคลนกับ tortoise-tts
หากคุณต้องการมีส่วนร่วมโปรดสร้างปัญหาที่ระบุว่าคุณต้องการทำงานอย่างไร DM ฉันบน Twitter หากคุณต้องการลิงค์เพื่อเข้าร่วม dev discord หรือถ้าคุณมีคำถาม ฉันยินดีที่จะช่วยให้ผู้คนเริ่มต้นด้วยการมีส่วนร่วม!
ฉันยังให้บริการส้อมของเต่า Tort-TTS ซึ่งมีคำอธิบายประกอบวิศวกรรมย้อนกลับของฉันและสคริปต์การส่งออกสำหรับโมเดล Autoregressive
สิ่งนี้ได้รับการปล่อยตัวด้วยใบอนุญาต MIT
ใบอนุญาต MIT
ลิขสิทธิ์ (c) 2024 John Balis
ได้รับอนุญาตโดยไม่ต้องเสียค่าใช้จ่ายสำหรับบุคคลใด ๆ ที่ได้รับสำเนาซอฟต์แวร์นี้และไฟล์เอกสารที่เกี่ยวข้อง ("ซอฟต์แวร์") เพื่อจัดการในซอฟต์แวร์โดยไม่มีการ จำกัด รวมถึง แต่ไม่ จำกัด เฉพาะสิทธิ์ในการใช้สำเนาดัดแปลงผสานเผยแพร่เผยแพร่
ประกาศลิขสิทธิ์ข้างต้นและประกาศการอนุญาตนี้จะรวมอยู่ในสำเนาทั้งหมดหรือส่วนสำคัญของซอฟต์แวร์
ซอฟต์แวร์มีให้ "ตามสภาพ" โดยไม่มีการรับประกันใด ๆ ไม่ว่าโดยชัดแจ้งหรือโดยนัยรวมถึง แต่ไม่ จำกัด เฉพาะการรับประกันความสามารถในการค้าการออกกำลังกายสำหรับวัตถุประสงค์เฉพาะและการไม่เข้าร่วม ไม่ว่าในกรณีใดผู้เขียนหรือผู้ถือลิขสิทธิ์จะต้องรับผิดชอบต่อการเรียกร้องความเสียหายหรือความรับผิดอื่น ๆ ไม่ว่าจะเป็นการกระทำของสัญญาการละเมิดหรืออื่น ๆ ที่เกิดขึ้นจากหรือเกี่ยวข้องกับซอฟต์แวร์หรือการใช้งานหรือการติดต่ออื่น ๆ ในซอฟต์แวร์
มาจาก Tortoise-TTS และ GGML
Apache 2.0 ใบอนุญาต James Betker https://github.com/neonbjb/tortoise-tts/blob/main/license
ใบอนุญาต MIT
ลิขสิทธิ์ (c) 2022 Georgi Gerganov
ได้รับอนุญาตโดยไม่ต้องเสียค่าใช้จ่ายสำหรับบุคคลใด ๆ ที่ได้รับสำเนาซอฟต์แวร์นี้และไฟล์เอกสารที่เกี่ยวข้อง ("ซอฟต์แวร์") เพื่อจัดการในซอฟต์แวร์โดยไม่มีการ จำกัด รวมถึง แต่ไม่ จำกัด เฉพาะสิทธิ์ในการใช้สำเนาดัดแปลงผสานเผยแพร่เผยแพร่
ประกาศลิขสิทธิ์ข้างต้นและประกาศการอนุญาตนี้จะรวมอยู่ในสำเนาทั้งหมดหรือส่วนสำคัญของซอฟต์แวร์
ซอฟต์แวร์มีให้ "ตามสภาพ" โดยไม่มีการรับประกันใด ๆ ไม่ว่าโดยชัดแจ้งหรือโดยนัยรวมถึง แต่ไม่ จำกัด เฉพาะการรับประกันความสามารถในการค้าการออกกำลังกายสำหรับวัตถุประสงค์เฉพาะและการไม่เข้าร่วม ไม่ว่าในกรณีใดผู้เขียนหรือผู้ถือลิขสิทธิ์จะต้องรับผิดชอบต่อการเรียกร้องความเสียหายหรือความรับผิดอื่น ๆ ไม่ว่าจะเป็นการกระทำของสัญญาการละเมิดหรืออื่น ๆ ที่เกิดขึ้นจากหรือเกี่ยวข้องกับซอฟต์แวร์หรือการใช้งานหรือการติดต่ออื่น ๆ ในซอฟต์แวร์