Sayit es una herramienta de línea de comando multiplataforma que pronuncia texto escrito. Puede usarlo para crear grabaciones de audio de sus archivos de texto o para mejorar su pronunciación en un idioma extranjero.
Sayit utiliza servicios cognitivos de Azure como backend para garantizar una calidad de audio óptima, por lo que requiere una suscripción a Azure, que puede obtener de forma gratuita aquí. Azure Cognitive Services Free Tier, a partir de 2021, incluye 5 horas de texto a voz por mes, que a menudo es suficiente para uso personal.
Puede descargar Sayit en la sección de lanzamiento. Sayit se distribuye actualmente como ejecutable de .NET autónomo (lo que significa que no necesitará instalar el tiempo de ejecución de .NET para usarlo) y como ejecutable de .NET dependiente del marco.
En el primer uso, debe ejecutar el Asistente de configuración ( ./sayit --setup ) e ingrese los parámetros de configuración de su recurso de servicios cognitivos Azure, como la clave de suscripción (que puede encontrar en el portal de Azure) y el identificador de región (ver aquí). Sayit almacenará estos parámetros en la carpeta de configuración del usuario actual (por ejemplo, ~/.config/ en Linux) como un archivo XML de configuración de la aplicación.
$ ./sayit --help
USAGE: sayit [--help] [--version] [--setup] [--list-voices] [--list-formats]
[--voice <voice>] [--format <format>] [--output <output>] [<input>]
INPUT:
<input> the text to be pronounced
(if missing, sayit will try to read it from stdin)
OPTIONS:
--version print sayit version
--setup setup the configuration file
--list-voices, -lv list the available voice shorthands
with their corresponding voice ids
--list-formats, -lf list the available output format shorthands
with their corresponding output format ids
--voice, -v <voice> the voice shorthand
--format, -f <format> the audio output format shorthand
--output, -o <output> the path of the output file
--help display this list of options.
Sayit admite estas configuraciones:
audio-16khz-32kbitrate-mono-mp3 , audio-16khz-64kbitrate-mono-mp3 , audio-16khz-128kbitrate-mono-mp3 , audio-24khz-96kbitrate-mono-mp3 , audio-24khz-160kbitrate-mono-mp3 , audio-24khz-48kbitrate-mono-mp3 , riff-8khz-16bit-mono-pcm , riff-16khz-16bit-mono-pcm , riff-24khz-16bit-mono-pcm .NB: Algunos idiomas y formatos de salida pueden no ser respaldados por su recurso de servicios cognitivos de Azure, dependiendo de su región (ver aquí).
NB: La elección de voces y formatos compatibles ha sido algo aleatoria. Agradezco sugerencias y contribuciones, por supuesto.