Tensorvox는 이러한 기술에 대한 접근성을 높이기 위해 데스크탑에서 사용자 친화적이고 가벼운 신경 음성 합성을 가능하게하도록 설계된 응용 프로그램입니다.
주로 Tensorflowtts와 Coqui-tts 및 vits에 의해 구동되는이 제품은 Tensorflow 모델 (첫 2 명)과 상호 작용하기 위해 Tensorflow C API를 사용하여 순수한 C ++/QT로 작성되었습니다. 이런 식으로, 우리는 몇 개의 DLL만으로 기가 바이트 상당의 파이썬 라이브러리를 설치하지 않고 추론을 수행 할 수 있습니다.
Google Docs의 자세한 안내서
릴리스에서 사본을 잡고 .zip을 추출하고 모델 및 설치 지침에 대한 Google 드라이브 폴더를 확인하십시오.
자신의 모델을 사용하는 데 관심이 있다면 먼저 훈련을해야합니다.
Tensorvox는 세 가지 저장소의 모델을 지원합니다.
이 두 예는 필요한 것을 이해하기에 충분한 지침을 제공해야합니다. 이 목적을 위해 특별히 모델을 훈련하려면 Tensorflowtts를 추천합니다. Tensorflowtts는 최상의 지원을받는 것이므로 언어와 마찬가지로 가장 가깝기 때문에 영어 (Coqui 및 Tftts, Vits), 독일어 및 스페인어 (Tensorflowtts)에 제공됩니다. 즉, 당신은 아무것도 할 필요가 없습니다. Phoneme 세트가 IPA (스트레스 또는 nonstressed), ARPA 또는 Global Phone 인 한 코드를 수정하지 않고 언어를 추가 할 수 있습니다 (문제를 열면 설명하겠습니다).
현재 Windows 10 x64 (8.1에서 실행되는 보고서를 들었지만) 만 지원됩니다.
요구 사항 :
프라이밍 빌드 (모든 제공 라이브러리 포함) :
deps 폴더가 .Pro 및 기본 소스 파일과 같은 위치에 있도록 압축을 닫습니다.반짝이는 새 실행 파일을 시도하려면 위에서 설명한대로 프로그램 릴리스를 다운로드하고 해당 릴리스의 실행 파일을 새 릴리스로 바꿔야하므로 모든 DLL이 있습니다.
TODO : 컴파일에 대한 지침을 처음부터 추가하십시오.
libtorch : https://pytorch.org/cppdocs/installing.html
Tensorflow C API : https://www.tensorflow.org/install/lang_c
cppflow (tf c api-> c ++ 래퍼) : https://github.com/serizba/cppflow
Audiofile (Wav Export의 경우) : https://github.com/adamstark/audiofile
프레임리스 어두운 스타일 창 : https://github.com/jorgen-vikinggod/qt-frameless-window-darkstyle
현대 C ++의 JSON : https://github.com/nlohmann/json
r8brain-free-src (리샘플링) : https://github.com/avaneev/r8brain-free-src
rnnoise (cmake 버전, denoising output) : https://github.com/almogh52/rnnoise-cmake
Logitech LED Illumination SDK (마우스 RGB 통합) : https://www.logitechg.com/en-us/innovation/developer-lab.html
QCUSTOMBLOT : https://www.qcustollot.com/index.php/introduction
libnumbertext : https://github.com/numbertext/libnumbertext
여기에서 문제를 열거 나 Discord 서버에 가입하고 거기에서 무엇이든 물어볼 수 있습니다.
미디어/라이센스/기타 공식적인 물건 문의의 경우이 이메일로 보내십시오 : [email protected]
이 프로그램 자체는 MIT 라이센스가 있지만 사용하는 모델의 경우 라이센스 용어가 적용됩니다. 예를 들어, 베트남에 있고 Tensorflowtts 모델을 사용하는 경우 여기에서 몇 가지 세부 사항을 확인해야합니다.