TensorVox 다운로드 - TensorVox 소스 코드 다운로드

TensorVox

AI 소스 코드

TensorVox V1.0.0.0

다운로드

Tensorvox

Tensorvox는 이러한 기술에 대한 접근성을 높이기 위해 데스크탑에서 사용자 친화적이고 가벼운 신경 음성 합성을 가능하게하도록 설계된 응용 프로그램입니다.

주로 Tensorflowtts와 Coqui-tts 및 vits에 의해 구동되는이 제품은 Tensorflow 모델 (첫 2 명)과 상호 작용하기 위해 Tensorflow C API를 사용하여 순수한 C ++/QT로 작성되었습니다. 이런 식으로, 우리는 몇 개의 DLL만으로 기가 바이트 상당의 파이썬 라이브러리를 설치하지 않고 추론을 수행 할 수 있습니다.

시도해보십시오

Google Docs의 자세한 안내서

릴리스에서 사본을 잡고 .zip을 추출하고 모델 및 설치 지침에 대한 Google 드라이브 폴더를 확인하십시오.

자신의 모델을 사용하는 데 관심이 있다면 먼저 훈련을해야합니다.

지원되는 아키텍처

Tensorvox는 세 가지 저장소의 모델을 지원합니다.

Tensorflowtts : Fastspeech2, Tacotron2, Char 및 phoneme 기반 및 다중 대역 Melgan. 다음은 ljspeech 사전에 사전 간 Tacotron2 모델을 내보내는 방법을 보여주는 Colab 노트북입니다.
Coqui-TTS : Pytorch에서 텐서 플로로 변환 한 후 Tacotron2 (Phoneme 기반 IPA) 및 다중 대역 Melgan. 다음은 LJSpeech DDC 모델을 내보내는 방법을 보여주는 노트북입니다.
Jaywalnut310/vits : vits,이 모델은 완전히 E2E 모델입니다. (IPA 강조한 Phonemes) 내보내기 노트 :

이 두 예는 필요한 것을 이해하기에 충분한 지침을 제공해야합니다. 이 목적을 위해 특별히 모델을 훈련하려면 Tensorflowtts를 추천합니다. Tensorflowtts는 최상의 지원을받는 것이므로 언어와 마찬가지로 가장 가깝기 때문에 영어 (Coqui 및 Tftts, Vits), 독일어 및 스페인어 (Tensorflowtts)에 제공됩니다. 즉, 당신은 아무것도 할 필요가 없습니다. Phoneme 세트가 IPA (스트레스 또는 nonstressed), ARPA 또는 Global Phone 인 한 코드를 수정하지 않고 언어를 추가 할 수 있습니다 (문제를 열면 설명하겠습니다).

지침을 작성하십시오

현재 Windows 10 x64 (8.1에서 실행되는 보고서를 들었지만) 만 지원됩니다.

요구 사항 :

QT 제작자
MSVC 2017 (V141) 컴파일러

프라이밍 빌드 (모든 제공 라이브러리 포함) :

사전 컴파일 된 이진 의존성을 다운로드하고 포함합니다
deps 폴더가 .Pro 및 기본 소스 파일과 같은 위치에 있도록 압축을 닫습니다.
QT Creator로 프로젝트를 열고 컴파일러를 추가하고 컴파일하십시오.

반짝이는 새 실행 파일을 시도하려면 위에서 설명한대로 프로그램 릴리스를 다운로드하고 해당 릴리스의 실행 파일을 새 릴리스로 바꿔야하므로 모든 DLL이 있습니다.

TODO : 컴파일에 대한 지침을 처음부터 추가하십시오.

외부 (그리고 감사합니다)

libtorch : https://pytorch.org/cppdocs/installing.html
Tensorflow C API : https://www.tensorflow.org/install/lang_c
cppflow (tf c api-> c ++ 래퍼) : https://github.com/serizba/cppflow
Audiofile (Wav Export의 경우) : https://github.com/adamstark/audiofile
프레임리스 어두운 스타일 창 : https://github.com/jorgen-vikinggod/qt-frameless-window-darkstyle
현대 C ++의 JSON : https://github.com/nlohmann/json
r8brain-free-src (리샘플링) : https://github.com/avaneev/r8brain-free-src
rnnoise (cmake 버전, denoising output) : https://github.com/almogh52/rnnoise-cmake
Logitech LED Illumination SDK (마우스 RGB 통합) : https://www.logitechg.com/en-us/innovation/developer-lab.html
QCUSTOMBLOT : https://www.qcustollot.com/index.php/introduction
libnumbertext : https://github.com/numbertext/libnumbertext