
저장소를 다음 명령으로 복제하십시오
git clone --recursive https://github.com/balisujohn/tortoise.cpp.git
현재 Cuda와 CPU 만. 컴파일 :
mkdir build
cd build
cmake ..
make
이것은 Mac OS ARM으로 테스트됩니다
mkdir build
cd build
cmake .. -DGGML_CUBLAS=ON
make
이것은 Ubuntu 22.04 및 Cuda 12.0 및 1070ti로 테스트됩니다.
mkdir build
cd build
cmake .. -DGGML_METAL=ON
make
소문자, 공간 및 구두점만이 프롬프트에서 뒷받침됩니다.
ggml-model.bin , ggml-vocoder-model.bin 및 ggml-diffusion-model.bin 모델 디렉토리에 배치해야합니다. 여기에서 https://huggingface.co/balisujohn/tortoise-ggml에서 다운로드 할 수 있습니다. Tortoise-Tts에서 이러한 파일을 생성하기위한 스크립트를 출시 할 것입니다.
빌드 디렉토리에서 실행 :
./tortoise
다음은 상자에서 벗어나야 할 예입니다.
./tortoise --message "based... dr freeman?" --voice "../models/mouse.bin" --seed 0 --output "based?.wav"
모든 명령 줄 인수는 선택 사항입니다.
arguments:
--message Specifies the message to generate, lowercase letters, spaces, and punctuation only. (default: "this is a test message." )
--voice Specifies the path to the voice file to use to determine the speaker's voice. (default: "../models/mol.bin" )
--output Specifies the path where the generated wav file will be saved. (default: "./output.wav")
--seed Specifies the seed for psuedorandom number generation, used in autoregressive sampling and diffusion sampling (default: system time seed)
원래 거북이 -Tts를 설정 한 다음 어떤 목소리로든 실행 한 다음이 줄 다음에 실행하십시오. https://github.com/neonbjb/tortoise-tts/blob/e2d9fba0bb5c4376d142efea47a448f97c4d90/tortoise/api.l401.
이 코드 추가 :
numpy_array = auto_conditioning.to("cpu").numpy().astype(np.float32) # Ensure float32 for binary format
# Define the file path
file_path = 'auto_conditioning.bin'
# Save NumPy array as binary file
numpy_array.tofile(file_path)
print("saved auto conditioning")
exit()
그런 다음 auto_conditioning.bin 스피커 이름으로 바꾸고 모델 폴더에 파일을 넣어 다른 음성과 마찬가지로 사용할 수 있습니다. 이것은 tortoise-tts 로 복제 된 목소리로 작동합니다.
기여하고 싶다면 작업하고 싶은 것을 진술하는 문제를 해결하십시오. DEV Discord에 가입 할 링크를 원하거나 궁금한 점이 있으면 DM Twitter에서 DM Me. 사람들이 기고를 시작하도록 도와 드리겠습니다!
또한 리버스 엔지니어링 주석이있는 거북이의 포크와 자동 회귀 모델에 대한 내보내기 스크립트를 사용할 수 있습니다.
이것은 MIT 라이센스로 릴리스됩니다.
MIT 라이센스
저작권 (c) 2024 John Balis
이에 따라이 소프트웨어 및 관련 문서 파일 ( "소프트웨어")의 사본을 얻는 사람에게는 허가가 부여됩니다. 소프트웨어의 사용, 복사, 수정, 합병, 배포, 배포, 숭고 및/또는 소프트웨어의 사본을 판매 할 권한을 포함하여 제한없이 소프트웨어를 처리 할 수 있도록 소프트웨어를 제공 할 권한이 없습니다.
위의 저작권 통지 및이 권한 통지는 소프트웨어의 모든 사본 또는 실질적인 부분에 포함되어야합니다.
이 소프트웨어는 상업성, 특정 목적에 대한 적합성 및 비 침해에 대한 보증을 포함하여 명시 적 또는 묵시적 보증없이 "그대로"제공됩니다. 어떠한 경우에도 저자 또는 저작권 보유자는 계약, 불법 행위 또는 기타, 소프트웨어 또는 소프트웨어의 사용 또는 기타 거래에서 발생하는 계약, 불법 행위 또는 기타의 행동에 관계없이 청구, 손해 또는 기타 책임에 대해 책임을지지 않습니다.
거북이 -TTS 및 GGML에서 파생됩니다.
Apache 2.0 라이센스 James Betker https://github.com/neonbjb/tortoise-tts/blob/main/license
MIT 라이센스
저작권 (C) 2022 Georgi Gerganov
이에 따라이 소프트웨어 및 관련 문서 파일 ( "소프트웨어")의 사본을 얻는 사람에게는 허가가 부여됩니다. 소프트웨어의 사용, 복사, 수정, 합병, 배포, 배포, 숭고 및/또는 소프트웨어의 사본을 판매 할 권한을 포함하여 제한없이 소프트웨어를 처리 할 수 있도록 소프트웨어를 제공 할 권한이 없습니다.
위의 저작권 통지 및이 권한 통지는 소프트웨어의 모든 사본 또는 실질적인 부분에 포함되어야합니다.
이 소프트웨어는 상업성, 특정 목적에 대한 적합성 및 비 침해에 대한 보증을 포함하여 명시 적 또는 묵시적 보증없이 "그대로"제공됩니다. 어떠한 경우에도 저자 또는 저작권 보유자는 계약, 불법 행위 또는 기타, 소프트웨어 또는 소프트웨어의 사용 또는 기타 거래에서 발생하는 계약, 불법 행위 또는 기타의 행동에 관계없이 청구, 손해 또는 기타 책임에 대해 책임을지지 않습니다.