babylon.cpp
v0.0.2

Babylon.cpp est une bibliothèque C et C ++ pour la conversion de graphème à phonèmes et le texte en synthèse de la parole. Pour la phonémisation, un port d'exécution ONNX du modèle Deepphonemizer est utilisé. Pour la synthèse de la parole, des modèles sont utilisés. Les modèles Piper sont compatibles une fois un script de conversion exécuté.
Pour construire et exécuter la bibliothèque, exécutez les commandes suivantes:
make
./bin/babylon_example Pour réduire le temps de compilation par défaut, Libary utilise des bibliothèques partagées onnxruntime fournies par Microsoft. Cela peut être remplacé en définissant BABYLON_BUILD_SOURCE ON .
#include "babylon.h"
int main () {
babylon_g2p_options_t options = {
. language = "en_us" ,
. use_dictionaries = 1 ,
. use_punctuation = 1 ,
};
babylon_g2p_init ( "path/to/deep_phonemizer.onnx" , options );
const char * text = "Hello World" ;
babylon_tts_init ( "path/to/vits.onnx" );
babylon_tts ( text , "path/to/output.wav" );
babylon_tts_free ();
babylon_g2p_free ();
return 0 ;
}# include " babylon.hpp "
int main () {
DeepPhonemizer::Session dp ( " path/to/deep_phonemizer.onnx " );
Vits::Session vits ( " path/to/vits.onnx " );
std::string text = " Hello World " ;
std::vector<std::string> phonemes = dp. g2p (text);
vits. tts (phonemes, " path/to/output.wav " );
return 0 ;
}