Sayit เป็นเครื่องมือบรรทัดคำสั่งข้ามแพลตฟอร์มที่ออกเสียงข้อความที่เขียน คุณสามารถใช้เพื่อสร้างการบันทึกเสียงของไฟล์ข้อความของคุณหรือเพื่อปรับปรุงการออกเสียงของคุณในภาษาต่างประเทศ
Sayit ใช้ Azure Cognitive Services เป็นแบ็กเอนด์เพื่อรับประกันคุณภาพเสียงที่ดีที่สุดดังนั้นจึงต้องสมัครสมาชิก Azure ซึ่งคุณสามารถรับได้ฟรีที่นี่ Azure Cognitive Services Free Tier ณ ปี 2021 รวมถึง 5 ชั่วโมงข้อความเป็นคำพูดต่อเดือนซึ่งมักจะเพียงพอสำหรับการใช้งานส่วนตัว
คุณสามารถดาวน์โหลด Sayit ในส่วนการเปิดตัว Sayit มีการแจกจ่ายทั้งสองในรูปแบบ. NET ที่มีอยู่ในตัวเอง
ในการใช้งานครั้งแรกคุณจำเป็นต้องเรียกใช้ตัวช่วยสร้างการตั้งค่า ( ./sayit --setup ) และป้อนพารามิเตอร์การกำหนดค่าของทรัพยากรบริการความรู้ความเข้าใจ Azure ของคุณเช่นคีย์การสมัครสมาชิก (ซึ่งคุณสามารถค้นหาได้ในพอร์ทัล Azure) และตัวระบุภูมิภาค (ดูที่นี่) Sayit จะจัดเก็บพารามิเตอร์เหล่านี้ในโฟลเดอร์การกำหนดค่าของผู้ใช้ปัจจุบัน (เช่น ~/.config/ in Linux) เป็นไฟล์การตั้งค่าแอป XML
$ ./sayit --help
USAGE: sayit [--help] [--version] [--setup] [--list-voices] [--list-formats]
[--voice <voice>] [--format <format>] [--output <output>] [<input>]
INPUT:
<input> the text to be pronounced
(if missing, sayit will try to read it from stdin)
OPTIONS:
--version print sayit version
--setup setup the configuration file
--list-voices, -lv list the available voice shorthands
with their corresponding voice ids
--list-formats, -lf list the available output format shorthands
with their corresponding output format ids
--voice, -v <voice> the voice shorthand
--format, -f <format> the audio output format shorthand
--output, -o <output> the path of the output file
--help display this list of options.
Sayit สนับสนุนการตั้งค่าเหล่านี้:
audio-16khz-32kbitrate-mono-mp3 , audio-16khz-64kbitrate-mono-mp3 audio-16khz-128kbitrate-mono-mp3 audio-24khz-96kbitrate-mono-mp3 audio-24khz-160kbitrate-mono-mp3 audio-24khz-48kbitrate-mono-mp3 , riff-8khz-16bit-mono-pcm , riff-16khz-16bit-mono-pcm , riff-24khz-16bit-mono-pcmNB: บางภาษาและรูปแบบผลลัพธ์อาจไม่ได้รับการสนับสนุนโดยทรัพยากรบริการความรู้ความเข้าใจ Azure ของคุณขึ้นอยู่กับภูมิภาค (ดูที่นี่)
NB: ทางเลือกของเสียงและรูปแบบที่รองรับนั้นค่อนข้างสุ่ม ฉันยินดีต้อนรับข้อเสนอแนะและการมีส่วนร่วมแน่นอน