Sayit é uma ferramenta de linha de comando de plataforma cruzada que pronuncia o texto escrito. Você pode usá -lo para criar gravações de áudio de seus arquivos de texto ou para melhorar sua pronúncia em um idioma estrangeiro.
A Sayit usa os serviços cognitivos do Azure como back -end para garantir a qualidade ideal do áudio, por isso requer uma assinatura do Azure, que você pode obter de graça aqui. Os Serviços Cognitivos do Azure, a camada gratuita, a partir de 2021, inclui 5 horas de texto em fala por mês, o que geralmente é suficiente para uso pessoal.
Você pode baixar o Sayit na seção de lançamento. Atualmente, o Sayit está distribuído como executável .NET independente (o que significa que você não precisará instalar o tempo de execução .NET para usá-lo) e como executável .NET dependente da estrutura.
No primeiro uso, é necessário executar o assistente de configuração ( ./sayit --setup ) e inserir os parâmetros de configuração do seu recurso de serviços cognitivos do Azure, como a chave de assinatura (que você pode encontrar no portal do Azure) e o identificador da região (veja aqui). A Sayit armazenará esses parâmetros na pasta de configuração do usuário atual (por exemplo ~/.config/ in linux) como um arquivo XML de configuração de aplicativo.
$ ./sayit --help
USAGE: sayit [--help] [--version] [--setup] [--list-voices] [--list-formats]
[--voice <voice>] [--format <format>] [--output <output>] [<input>]
INPUT:
<input> the text to be pronounced
(if missing, sayit will try to read it from stdin)
OPTIONS:
--version print sayit version
--setup setup the configuration file
--list-voices, -lv list the available voice shorthands
with their corresponding voice ids
--list-formats, -lf list the available output format shorthands
with their corresponding output format ids
--voice, -v <voice> the voice shorthand
--format, -f <format> the audio output format shorthand
--output, -o <output> the path of the output file
--help display this list of options.
Sayit suporta estas configurações:
audio-16khz-32kbitrate-mono-mp3 , audio-16khz-64kbitrate-mono-mp3 , audio-16khz-128kbitrate-mono-mp3 , audio-24khz-96kbitrate-mono-mp3 , audio-24khz-160kbitrate-mono-mp3 audio-24khz-48kbitrate-mono-mp3 , riff-8khz-16bit-mono-pcm , riff-16khz-16bit-mono-pcm , riff-24khz-16bit-mono-pcm .NB: Alguns idiomas e formatos de saída podem não ser suportados pelo seu recurso de serviços cognitivos do Azure, dependendo de sua região (veja aqui).
NB: A escolha de vozes e formatos suportados tem sido um pouco aleatória. Congratulo -me com sugestões e contribuições, é claro.