Sayit은 서면 텍스트를 발음하는 크로스 플랫폼 명령 줄 도구입니다. 이를 사용하여 텍스트 파일의 오디오 녹음을 만들거나 외국어로 발음을 향상시킬 수 있습니다.
Sayit는 Azure Cognitive Services를 백엔드로 사용하여 최적의 오디오 품질을 보장하므로 Azure에 가입해야합니다. 2021 년 현재 Azure Cognitive Services Free Tier에는 한 달에 5 개의 텍스트 음성 시간이 포함되어 있으며, 이는 종종 개인적으로 사용하기에 충분합니다.
릴리스 섹션에서 sayit을 다운로드 할 수 있습니다. Sayit은 현재 자체 포함 된 .NET 실행 가능 (이를 사용하기 위해 .NET 런타임을 설치할 필요가 없음)으로 분산되어 있으며 프레임 워크 의존적 .NET 실행 가능로 배포됩니다.
처음 사용하면 설정 마법사 ( ./sayit --setup )를 실행하고 구독 키 (Azure Portal에서 찾을 수있는) 및 지역 식별자 (여기서 참조)와 같은 Azure Cognitive Services 리소스의 구성 매개 변수를 입력해야합니다. Sayit은 이러한 매개 변수를 현재 사용자의 구성 폴더 (예 : ~/.config/ in linux)에 XML 파일로 저장합니다.
$ ./sayit --help
USAGE: sayit [--help] [--version] [--setup] [--list-voices] [--list-formats]
[--voice <voice>] [--format <format>] [--output <output>] [<input>]
INPUT:
<input> the text to be pronounced
(if missing, sayit will try to read it from stdin)
OPTIONS:
--version print sayit version
--setup setup the configuration file
--list-voices, -lv list the available voice shorthands
with their corresponding voice ids
--list-formats, -lf list the available output format shorthands
with their corresponding output format ids
--voice, -v <voice> the voice shorthand
--format, -f <format> the audio output format shorthand
--output, -o <output> the path of the output file
--help display this list of options.
Sayit은 다음과 같은 설정을 지원합니다.
audio-16khz-32kbitrate-mono-mp3 , audio-16khz-64kbitrate-mono-mp3 , audio-16khz-128kbitrate-mono-mp3 , audio-24khz-96kbitrate-mono-mp3 , audio-24khz-160kbitrate-mono-mp3 , audio-24khz-48kbitrate-mono-mp3 , riff-8khz-16bit-mono-pcm , riff-16khz-16bit-mono-pcm , riff-24khz-16bit-mono-pcm .NB : 일부 언어 및 출력 형식은 해당 지역에 따라 Azure Cognitive Services 리소스에서 지원되지 않을 수 있습니다 (여기 참조).
NB : 지원되는 목소리와 형식의 선택은 다소 무작위입니다. 물론 제안과 기여를 환영합니다.