Tarakotalk

นี่คือเครื่องมือ CLI TTS ที่ไม่เป็นทางการ (ข้อความเป็นคำพูด) ที่ให้ฮิโรยูกิพูดสิ่งที่เหมาะสมจาก CLI โดยใช้ผู้ผลิต Ochari Hiroyuki
คุณสมบัติ
มันใช้คำสั่งย่อยสองรายการ: save ซึ่งบันทึกเสียงที่สร้างขึ้นไปยังไฟล์และ play ซึ่งเล่นเสียงที่สร้างขึ้นเช่นเดียวกับพีซี
ซึ่งแตกต่างจากเว็บไซต์ที่มีขีด จำกัด 140 ตัวอักษร Tarakotalk อนุญาตให้ Hiroyuki พูดข้อความได้มากถึง 1,000 อักขระ (ตามข้อกำหนด API ณ วันที่ 6 กันยายน 2022)
นอกจากนี้คุณยังสามารถคัดลอกและวางหรือให้ฮิโรยูกิอ่านเรื่องสั้นดัง
ดูเหมือนว่าอันที่สั้นที่สุดใช้เวลาประมาณ 5 วินาทีและสูงสุด 15 วินาทีในการสร้างเสียง (อาจจะมากกว่านี้หากเซิร์ฟเวอร์ไม่ว่าง)
- บันทึกเสียงที่สร้างขึ้นเป็นไฟล์ (
save )- ข้อความที่คุณต้องการพูดสามารถป้อนได้จากอาร์กิวเมนต์บรรทัดคำสั่งไฟล์ข้อความหรืออินพุตมาตรฐาน (ผ่านไปป์)
- บันทึกเสียงที่สร้างขึ้นในรูปแบบ WAV ไปยังเส้นทางไฟล์ที่ระบุ
- เสียงที่สร้างขึ้นจะถูกส่งออกไปยังเอาต์พุตมาตรฐาน (ผ่านไปป์) ในรูปแบบ WAV
- หากคุณติดตั้ง FFMPEG แยกกันคุณสามารถแปลงจาก WAV เป็น MP3 หรือรูปแบบเสียงอื่น ๆ ด้วย
tarakotalk save "それって、あなたの感想ですよね?" "-" | ffmpeg -i - test.mp3
- เล่นเสียงที่สร้างขึ้นบนพีซีของคุณ (
play )- ข้อความที่คุณต้องการพูดสามารถป้อนได้จากอาร์กิวเมนต์บรรทัดคำสั่งไฟล์ข้อความหรืออินพุตมาตรฐาน (ผ่านไปป์)
- เสียงที่สร้างขึ้นนั้นเล่นโดยตรงจากลำโพงพีซี (เข้ากันได้กับข้ามแพลตฟอร์ม)
วิธีใช้
ดาวน์โหลด Tarakotalk ล่าสุดจากรุ่นและวางไว้ในโฟลเดอร์ที่เส้นทางของคุณผ่านไป
Tarakotalk เป็นเครื่องมือ Python แต่มันถูกสร้างขึ้นเป็นไบนารีเดียวโดยใช้ Nuitka
- Windows (x64): tarakotalk.exe
- macOS (x64): tarakotalk-macos
- เป็นเพียงรุ่น Intel Mac เท่านั้น แต่ควรใช้งานกับ Apple Silicon (M1) Mac หากรวม Rosetta 2 ... ?
- Linux (x64): tarakotalk-linux
- Linux (ARM64): Tarakotalk-Linux-arm
มีสี่สร้างด้านบน โปรดดาวน์โหลดตามระบบปฏิบัติการของคุณ
usage: ./tarakotalk [-h] {save,play} ...
Cross-platform CLI TTS Tools for Hiroyuki's Voice
positional arguments:
{save,play}
save 生成した音声をファイルに保存する
play 生成した音声を PC 上で再生する
options:
-h, --help show this help message and exit
tarakotalk save
usage: ./tarakotalk save [-h] input output
positional arguments:
input ひろゆきに喋らせるテキスト (文字列 or ファイルパス、"-" で標準入力から読み込み)
output 生成した音声ファイル (wav) の保存先のファイルパス ("-" で標準出力に出力)
options:
-h, --help show this help message and exit
# コマンドライン引数からテキストを入力し、生成した音声を /path/to/test.wav に保存
. / tarakotalk save "それって、あなたの感想ですよね? " " /path/to/test.wav "
# ファイルからテキストを入力し、生成した音声を標準出力に出力したあと、FFmpeg に渡して mp3 に変換
. / tarakotalk save " /path/to/yoshinoya.txt " " - " | ffmpeg - i - - c:a libmp3lame / path / to / test.mp3
# 標準入力からテキストを読み上げ、生成した音声を /path/to/test.wav に保存
echo "それって、あなたの感想ですよね? " | . / tarakotalk save " - " " /path/to/test.wav "
tarakotalk play
usage: ./tarakotalk play [-h] input
positional arguments:
input ひろゆきに喋らせるテキスト (文字列 or ファイルパス、"-" で標準入力から読み込み)
options:
-h, --help show this help message and exit
# コマンドライン引数からテキストを読み上げ
. / tarakotalk play "それって、あなたの感想ですよね? "
# ファイルからテキストを読み上げ
. / tarakotalk play " /path/to/yoshinoya.txt "
# 標準入力からテキストを読み上げ
echo "それって、あなたの感想ですよね? " | . / tarakotalk play " - "
ตัวอย่างการใช้งาน
ฉันเพิ่งได้รับตัวอย่างแบบสุ่มที่ดูเหมือนว่าจะใช้งานได้ในตอนนี้ (จำเป็นต้องอ้างอิง) และยังไม่ได้รับการตรวจสอบว่าสามารถใช้งานได้จริงหรือไม่
- ให้ฮิโรยูกิอ่านสำเนาและวางของโยชิโนยะ
- ให้พวกเขาอ่านความคิดเห็นจากการแชทสดเช่น boyomi-chan
- คุณจะต้องใช้เครื่องมือแยกต่างหากที่อนุญาตให้คุณดำเนินการคำสั่งพร้อมกับเนื้อหาความคิดเห็นเมื่อคุณได้รับความคิดเห็นจากการแชทสด ฉันไม่รู้ว่ามีอะไรแบบนั้นหรือไม่
- แม้แต่ความคิดเห็นสั้น ๆ ก็ใช้เวลาสองสามวินาทีในการสร้างเสียงดังนั้นประสิทธิภาพแบบเรียลไทม์จะลดลงอย่างหลีกเลี่ยงไม่ได้
- ฉันติดตั้ง Tarakotalk บน Raspberry Pi ของฉันและให้ Hiroyuki อ่านสภาพอากาศและข่าวของวันนี้จากลำโพงที่เชื่อมต่อกับ Raspberry Pi ของฉันเวลา 8.00 น.
- การสร้างคือ (แน่นอน) ที่เหลืออยู่ในเซิร์ฟเวอร์ของ Coefont ดังนั้นแม้แต่เครื่องที่อ่อนแอเช่น Raspberry Pi ก็ควรจะสามารถสร้างได้อย่างรวดเร็ว
- เสียงที่สร้างขึ้นสามารถเล่นกับเอาต์พุตมาตรฐานดังนั้นหากคุณได้รับอินพุตมาตรฐานที่ได้รับการส่งผ่าน FFMPEG (
-i - ) คุณสามารถแปลงเป็นรูปแบบเสียงอื่นหรือเปลี่ยนความเร็วในการเล่นขึ้นอยู่กับคำสั่ง FFMPEG - คุณยังสามารถใช้ FFMPEG เพื่อเพิ่มเพลงพื้นหลังหรือกรองเสียง
- ใช้วิดีโอเป็นคำบรรยายเพื่ออ่านฮิโรยูกิ
- หากคุณต้องการใช้สำหรับการสร้างวิดีโอฮิโรยูกิจะรวมอยู่ใน Coefont อย่างเป็นทางการซึ่งใช้งานฟรีและไม่ จำกัด ภายใน Coefont Cloud ดังนั้นฉันคิดว่ามันสะดวกกว่าที่จะใช้มันเพราะมันช่วยให้คุณเล่นน้ำเสียงและความเร็ว (ด้วยเหตุผลบางอย่าง
- คุณต้องลงชื่อเข้าใช้เพื่อใช้ Coefont Cloud
- coefont บางรายการจ่ายสินค้า แต่ Hiroyuki ดูเหมือนจะเป็นระดับฟรีตาม Arial Mial การหยดนั้นใหญ่มาก ...
- สำหรับวัสดุเสียง Mad เนื้อเพลงของเพลงต้นฉบับจะถูกส่งไปยัง Hiroyuki จากนั้นได้รับการฝึกฝนและทำการร้องเพลงแยกกันใน Reaper หรือ Vocalshifter
- เนื่องจากเป็นเครื่องมือ CLI จึงเป็นไปได้ที่จะสร้างเชลล์สคริปต์หรือบางอย่างเพื่อแยกเนื้อเพลงออกเป็นไฟล์ WAV หลายไฟล์เพื่อสร้าง
คำเตือน
- Tarakotalk เป็นเครื่องมือที่ไม่เป็นทางการ มันไม่มีส่วนเกี่ยวข้องกับเจ้าหน้าที่ Coefont
- Tarakotalk ได้รับเสียงของ Hiroyuki จาก CLI โดยเข้าถึง API ส่วนตัวที่ใช้โดยตรงจากผู้ผลิต Ochari Hiroyuki
- โปรดหยุดติดต่อ Coefont อย่างเป็นทางการเกี่ยวกับ Tarakotalk
- ไม่มีการรับประกัน
โปรด ใช้ Coefont อย่างเป็นทางการหรือ Hiroyuki เป็นทางออกที่เป็นความลับ- เราไม่สามารถรับผิดชอบต่อความผิดใด ๆ ที่เกิดขึ้นได้จากทุกที่ โปรดใช้ตามความเสี่ยงของคุณเอง
- นี่ไม่ใช่เครื่องมือที่เดิมเป็นสิ่งที่ดีเมื่อเข้าถึง API ส่วนตัวดังนั้นโปรดหยุดใช้มันในลักษณะที่ทำให้เซิร์ฟเวอร์ Coefont มากเกินไป
- เนื่องจากคำ NG ได้รับการตรวจสอบทางด้าน API จึงใช้กับคำ ng ไม่ว่าจะผ่าน tarakotalk หรือไม่
- มีความเป็นไปได้ที่จะไม่สามารถใช้งานได้อย่างฉับพลันเนื่องจากการเปลี่ยนแปลงของข้อกำหนด API ในด้าน coefont หรือการยกเลิกบริการ
ใบอนุญาต
ใบอนุญาต MIT