Sayit est un outil de ligne de commande multiplateforme qui prononce le texte écrit. Vous pouvez l'utiliser pour créer des enregistrements audio de vos fichiers texte ou pour améliorer votre prononciation dans une langue étrangère.
Sayit utilise les services cognitifs Azure comme backend pour garantir une qualité audio optimale, il faut donc un abonnement à Azure, que vous pouvez obtenir gratuitement ici. Le niveau gratuit des services cognitifs Azure, à partir de 2021, comprend 5 heures de texte vocale par mois, ce qui est souvent suffisant pour un usage personnel.
Vous pouvez télécharger Sayit dans la section version. Sayit est actuellement distribué à la fois en tant qu'exécutable .NET autonome (ce qui signifie que vous n'aurez pas besoin d'installer le .NET Runtime pour l'utiliser) et en fonction de .NET dépendant de Framework.
À la première utilisation, vous avez besoin d'exécuter l'assistant de configuration ( ./sayit --setup ) et entrez les paramètres de configuration de votre ressource Azure Cognitive Services, tels que la clé d'abonnement (que vous pouvez trouver dans le portail Azure) et l'identifiant de la région (voir ici). Sayit stockera ces paramètres dans le dossier de configuration de l'utilisateur actuel (par exemple ~/.config/ en Linux) en tant qu'application définissant le fichier XML.
$ ./sayit --help
USAGE: sayit [--help] [--version] [--setup] [--list-voices] [--list-formats]
[--voice <voice>] [--format <format>] [--output <output>] [<input>]
INPUT:
<input> the text to be pronounced
(if missing, sayit will try to read it from stdin)
OPTIONS:
--version print sayit version
--setup setup the configuration file
--list-voices, -lv list the available voice shorthands
with their corresponding voice ids
--list-formats, -lf list the available output format shorthands
with their corresponding output format ids
--voice, -v <voice> the voice shorthand
--format, -f <format> the audio output format shorthand
--output, -o <output> the path of the output file
--help display this list of options.
Sayit prend en charge ces paramètres:
audio-16khz-32kbitrate-mono-mp3 , audio-16khz-64kbitrate-mono-mp3 , audio-16khz-128kbitrate-mono-mp3 , audio-24khz-96kbitrate-mono-mp3 , Audio-24KHZ-160KBitrate-Mono-Monp3, audio-24khz-160kbitrate-mono-mp3 , audio-24khz-48kbitrate-mono-mp3 , riff-8khz-16bit-mono-pcm , riff-16khz-16bit-mono-pcm , riff-24khz-16bit-mono-pcm .NB: Certaines langues et formats de sortie pourraient ne pas être pris en charge par votre ressource Azure Cognitive Services, selon sa région (voir ici).
NB: Le choix des voix et des formats pris en charge a été quelque peu aléatoire. Je salue les suggestions et les contributions, bien sûr.