babylon.cpp
v0.0.2

Babylon.CPP는 음소 전환 및 음성 합성에 대한 텍스트를위한 C 및 C ++ 라이브러리입니다. 음성화의 경우 DeepPhonemizer 모델의 ONNX 런타임 포트가 사용됩니다. 음성 합성 VITS 모델이 사용됩니다. Piper 모델은 변환 스크립트가 실행 된 후에 호환됩니다.
라이브러리를 빌드하고 실행하려면 다음 명령을 실행합니다.
make
./bin/babylon_example 컴파일 시간을 기본적으로 줄이기 위해 Libary는 Microsoft가 제공하는 OnnxRuntime 공유 라이브러리를 사용합니다. 이것은 BABYLON_BUILD_SOURCE ON 으로 설정하여 무시할 수 있습니다.
#include "babylon.h"
int main () {
babylon_g2p_options_t options = {
. language = "en_us" ,
. use_dictionaries = 1 ,
. use_punctuation = 1 ,
};
babylon_g2p_init ( "path/to/deep_phonemizer.onnx" , options );
const char * text = "Hello World" ;
babylon_tts_init ( "path/to/vits.onnx" );
babylon_tts ( text , "path/to/output.wav" );
babylon_tts_free ();
babylon_g2p_free ();
return 0 ;
}# include " babylon.hpp "
int main () {
DeepPhonemizer::Session dp ( " path/to/deep_phonemizer.onnx " );
Vits::Session vits ( " path/to/vits.onnx " );
std::string text = " Hello World " ;
std::vector<std::string> phonemes = dp. g2p (text);
vits. tts (phonemes, " path/to/output.wav " );
return 0 ;
}