babylon.cpp
v0.0.2

Babylon.cpp adalah perpustakaan C dan C ++ untuk grapheme ke konversi fonem dan teks ke sintesis bicara. Untuk fonemisasi port runtime ONNX dari model deepphonemizer digunakan. Untuk sintesis ucapan, model VIT digunakan. Model Piper kompatibel setelah skrip konversi dijalankan.
Untuk membangun dan menjalankan perpustakaan jalankan perintah berikut:
make
./bin/babylon_example Untuk mengurangi waktu kompilasi secara default, libary menggunakan pustaka bersama onnxruntime yang disediakan oleh Microsoft. Ini dapat ditimpa dengan mengatur BABYLON_BUILD_SOURCE ke ON .
#include "babylon.h"
int main () {
babylon_g2p_options_t options = {
. language = "en_us" ,
. use_dictionaries = 1 ,
. use_punctuation = 1 ,
};
babylon_g2p_init ( "path/to/deep_phonemizer.onnx" , options );
const char * text = "Hello World" ;
babylon_tts_init ( "path/to/vits.onnx" );
babylon_tts ( text , "path/to/output.wav" );
babylon_tts_free ();
babylon_g2p_free ();
return 0 ;
}# include " babylon.hpp "
int main () {
DeepPhonemizer::Session dp ( " path/to/deep_phonemizer.onnx " );
Vits::Session vits ( " path/to/vits.onnx " );
std::string text = " Hello World " ;
std::vector<std::string> phonemes = dp. g2p (text);
vits. tts (phonemes, " path/to/output.wav " );
return 0 ;
}