babylon.cpp
v0.0.2

babylon.cpp เป็นไลบรารี C และ C ++ สำหรับกราฟเป็นการแปลงฟอนิมและการสังเคราะห์ข้อความเป็นคำพูด สำหรับการออกเสียงใช้พอร์ตรันไทม์ ONNX ของโมเดล deepphonemizer สำหรับการสังเคราะห์คำพูดนั้นใช้โมเดล โมเดลไพเพอร์เข้ากันได้หลังจากเรียกใช้สคริปต์การแปลง
ในการสร้างและเรียกใช้ไลบรารีเรียกใช้คำสั่งต่อไปนี้:
make
./bin/babylon_example เพื่อลดเวลาในการรวบรวมโดยค่าเริ่มต้น Libary ใช้ไลบรารีที่ใช้ร่วมกันใน OnnxRuntime โดย Microsoft สิ่งนี้สามารถแทนที่ได้โดยการตั้ง BABYLON_BUILD_SOURCE เป็น ON
#include "babylon.h"
int main () {
babylon_g2p_options_t options = {
. language = "en_us" ,
. use_dictionaries = 1 ,
. use_punctuation = 1 ,
};
babylon_g2p_init ( "path/to/deep_phonemizer.onnx" , options );
const char * text = "Hello World" ;
babylon_tts_init ( "path/to/vits.onnx" );
babylon_tts ( text , "path/to/output.wav" );
babylon_tts_free ();
babylon_g2p_free ();
return 0 ;
}# include " babylon.hpp "
int main () {
DeepPhonemizer::Session dp ( " path/to/deep_phonemizer.onnx " );
Vits::Session vits ( " path/to/vits.onnx " );
std::string text = " Hello World " ;
std::vector<std::string> phonemes = dp. g2p (text);
vits. tts (phonemes, " path/to/output.wav " );
return 0 ;
}