Projet de synthétiseur de chant en temps réel fabriqué à partir de Sinsy-NG. L'idée était de générer facilement des échantillons audio vocaux en temps réel pour des performances de codage en direct.
Voici une démonstration vidéo utilisant le programme pour synthétiser des échantillons et les charger dans l'environnement de codage Foxdot en direct.
Le logiciel contenu dans SyntheSissoftware doit être installé.
Vous pouvez consulter le cahier Colab pour un guide détaillé sur la façon de l'installer sur Ubuntu.
Si vous souhaitez le vérifier rapidement, vous pouvez l'essayer en ligne ici.
Construire
Courir
Une fois cela fait, vous pouvez essayer le script test-api.py comme un petit exemple de synthèse de chant. Après l'exécution, un fichier WAV de sortie sera généré contenant les voix spécifiées.
python test-api.py
Tous les paramètres sont facultatifs, ils contiennent une valeur par défaut au cas où ils ne seront pas spécifiés. Vous pouvez les spécifier dans n'importe quel ordre lors de l'exécution du programme dans la ligne de commande.
Remarques: La valeur numérique des notes dans l'échelle, dans C Major serait quelque chose comme 0: C, 1: D, 2: E, 3: F et ainsi de suite ... L'échelle est C Major par défaut, il est codé en dur dans le fichier Main.py et peut être modifié.
DUR: La durée de chaque note en BPM (battements par minute)
Paroles: Le texte à synthétiser. Chaque mot est mappé à une note des paramètres "dur" et "notes"
Lang: Le code de la langue, "es" pour l'espagnol et "en" pour l'anglais. Il y a plusieurs langues prises en charge, vous pouvez les vérifier ici
Tempo: Le tempo en BPM
Fichier: le nom du fichier de sortie
Si vous voulez m'aider à continuer de développer et à maintenir des projets open source, vous pouvez contribuer à m'acheter du ko-fi.