Tarakotalk

هذه أداة غير رسمية CLI TTS (نص إلى كلام) تتيح لهيرويوكي التحدث بأشياء مناسبة من CLI باستخدام صانع Ochari Hiroyuki.
سمات
إنه ينفذ سلستين فرعيتين: save ، والذي يحفظ الصوت الذي تم إنشاؤه إلى ملف ، play ، والذي يعزف الصوت الذي تم إنشاؤه كما هو على جهاز الكمبيوتر.
على عكس المواقع الإلكترونية التي يبلغ حجمها 140 حرفًا ، يسمح Tarakotalk Hiroyuki بالتحدث بنص ما يصل إلى 1000 حرف (استنادًا إلى مواصفات API اعتبارًا من 6 سبتمبر 2022).
يمكنك أيضًا نسخ ولصق أو جعل Hiroyuki قراءة القصص القصيرة بصوت عالٍ.
يبدو أن أقصر واحد يستغرق حوالي 5 ثوانٍ ، وما يصل إلى 15 ثانية لإنشاء الصوت (قد يكون أكثر إذا كان الخادم مشغولاً).
- حفظ الصوت الذي تم إنشاؤه إلى ملف (
save )- يمكن إدخال النص الذي تريد التحدث إليه من وسيطات سطر الأوامر أو الملفات النصية أو الإدخال القياسي (تمرير الأنابيب).
- احفظ الصوت الذي تم إنشاؤه بتنسيق WAV إلى مسار الملف المحدد
- يتم إخراج الصوت الذي تم إنشاؤه إلى الإخراج القياسي (من خلال الأنابيب) بتنسيق WAV.
- إذا قمت بتثبيت FFMPEG بشكل منفصل ، فيمكنك التحويل من WAV إلى MP3 أو تنسيقات صوتية أخرى مع
tarakotalk save "それって、あなたの感想ですよね?" "-" | ffmpeg -i - test.mp3 .
- قم بتشغيل الصوت الذي تم إنشاؤه على جهاز الكمبيوتر الخاص بك (
play )- يمكن إدخال النص الذي تريد التحدث إليه من وسيطات سطر الأوامر أو الملفات النصية أو الإدخال القياسي (تمرير الأنابيب).
- يتم تشغيل الصوت الذي تم إنشاؤه مباشرة من مكبر صوت الكمبيوتر (متوافق مع المنصات)
كيفية استخدام
قم بتنزيل أحدث Tarakotalk من الإصدارات ووضعها في المجلد حيث يمر مسارك.
Tarakotalk هي أداة Python ، لكنها مدمجة في ثنائي واحد باستخدام Nuitka.
- Windows (x64): tarakotalk.exe
- ماكوس (X64): Tarakotalk-Macos
- إنه فقط لإصدار Intel Mac ، ولكن يجب أن يعمل على MAC Apple Silicon (M1) إذا تم تضمين Rosetta 2 ...؟
- Linux (X64): Tarakotalk-Linux
- Linux (ARM64): Tarakotalk-Linux-Arm
هناك أربعة بنيات أعلاه. يرجى تنزيله وفقًا لنظام التشغيل الخاص بك.
usage: ./tarakotalk [-h] {save,play} ...
Cross-platform CLI TTS Tools for Hiroyuki's Voice
positional arguments:
{save,play}
save 生成した音声をファイルに保存する
play 生成した音声を PC 上で再生する
options:
-h, --help show this help message and exit
tarakotalk save
usage: ./tarakotalk save [-h] input output
positional arguments:
input ひろゆきに喋らせるテキスト (文字列 or ファイルパス、"-" で標準入力から読み込み)
output 生成した音声ファイル (wav) の保存先のファイルパス ("-" で標準出力に出力)
options:
-h, --help show this help message and exit
# コマンドライン引数からテキストを入力し、生成した音声を /path/to/test.wav に保存
. / tarakotalk save "それって、あなたの感想ですよね? " " /path/to/test.wav "
# ファイルからテキストを入力し、生成した音声を標準出力に出力したあと、FFmpeg に渡して mp3 に変換
. / tarakotalk save " /path/to/yoshinoya.txt " " - " | ffmpeg - i - - c:a libmp3lame / path / to / test.mp3
# 標準入力からテキストを読み上げ、生成した音声を /path/to/test.wav に保存
echo "それって、あなたの感想ですよね? " | . / tarakotalk save " - " " /path/to/test.wav "
tarakotalk play
usage: ./tarakotalk play [-h] input
positional arguments:
input ひろゆきに喋らせるテキスト (文字列 or ファイルパス、"-" で標準入力から読み込み)
options:
-h, --help show this help message and exit
# コマンドライン引数からテキストを読み上げ
. / tarakotalk play "それって、あなたの感想ですよね? "
# ファイルからテキストを読み上げ
. / tarakotalk play " /path/to/yoshinoya.txt "
# 標準入力からテキストを読み上げ
echo "それって、あなたの感想ですよね? " | . / tarakotalk play " - "
أمثلة على الاستخدام
لقد أعطيت للتو مثالًا عشوائيًا يبدو أنه قابل للاستخدام في الوقت الحالي (المرجع المطلوب) ، ولم يتم التحقق منه ما إذا كان يمكن استخدامه بالفعل.
- اطلب من هيرويوكي قراءة نسخة ولصق يوشينويا
- اطلب منهم قراءة تعليقات من الدردشة الحية مثل Boyomi-chan
- ستحتاج إلى أداة منفصلة تتيح لك تنفيذ الأوامر مع محتوى التعليق عند تلقي تعليق من الدردشة المباشرة. لا أعرف ما إذا كان هناك شيء من هذا القبيل.
- حتى التعليقات القصيرة تستغرق بضع ثوان لتوليد الصوت ، لذلك سينخفض الأداء في الوقت الفعلي حتماً.
- لقد قمت بتثبيت Tarakotalk على Raspberry Pi الخاص بي ودع Hiroyuki يقرأ الطقس وأخبار اليوم من المتحدث المتصل بـ Raspberry Pi في الساعة 8 صباحًا.
- يتم ترك الجيل (بالطبع) لخادم Coefont ، لذلك حتى الجهاز الضعيف مثل Raspberry Pi يجب أن يكون قادرًا على إنشاءه بسرعة إلى حد ما.
- يمكن تشغيل الصوت الذي تم إنشاؤه على الإخراج القياسي ، لذلك إذا تلقيت الإدخال القياسي الذي تم تنشيطه من خلال FFMPEG (
-i - ) ، فيمكنك تحويله إلى تنسيق صوتي آخر أو تغيير سرعة التشغيل اعتمادًا على أمر FFMPEG. - يمكنك أيضًا استخدام FFMPEG لإضافة موسيقى خلفية أو تصفية الصوت.
- استخدم الفيديو كرواية لقراءة هيرويوكي
- إذا كنت ترغب في استخدامه لإنشاء الفيديو ، يتم تضمين Hiroyuki رسميًا في Coefont ، وهو استخدام مجاني وغير محدود داخل Coefont Cloud ، لذلك أعتقد أنه من المناسب استخدام ذلك ، لأنه يتيح لك لعب التجويد والسرعة (لسبب ما لم يتم الإعلان عنه كثيرًا ...).
- يجب تسجيل الدخول لاستخدام Coefont Cloud.
- دفعت بعض Coefont عناصر ، ولكن يبدو أن Hiroyuki هي الطبقة الحرة ، بعد Arial Mial. الانخفاض ضخم ...
- بالنسبة للمواد المجنونة الصوتية ، يتم إرسال كلمات الأغنية الأصلية إلى Hiroyuki ، ثم تدربها على الغناء بشكل منفصل في Reaper أو VocalShifter.
- نظرًا لأنها أداة CLI ، فمن الممكن إنشاء برنامج نصي Shell أو شيء لتقسيم الأغاني إلى ملفات WAV متعددة لإنشاءها.
تنصل
- Tarakotalk هي أداة غير رسمية. لا علاقة له بمسؤول Coefont.
- يحصل Tarakotalk على صوت Hiroyuki من CLI من خلال الوصول مباشرة إلى واجهات برمجة التطبيقات الخاصة التي يستخدمها شركة Ochari Hiroyuki Maker.
- يرجى التوقف عن الاتصال بـ Coefont رسميًا حول Tarakotalk.
- لا ضمان.
يرجى استخدام Coefont رسميًا أو هيرويوكي نفسه كحل سري.- لا يمكننا تحمل أي مسؤولية عن أي جرائم تنشأ من أي مكان. يرجى استخدامه على مسؤوليتك الخاصة.
- هذه ليست أداة جيدة في الأصل عند الوصول إلى واجهات برمجة التطبيقات الخاصة ، لذا يرجى التوقف عن استخدامها بطريقة تضع الكثير من الضغط على خوادم Coefont.
- نظرًا لأنه يتم التحقق من صحة كلمات NG على جانب API ، فإن الشيء نفسه ينطبق على كلمات NG ، سواء عبر Tarakotalk أم لا.
- هناك احتمال أن تصبح فجأة غير صالحة للاستعمال بسبب التغيرات في مواصفات API على جانب Coefont أو إنهاء الخدمة.
رخصة
رخصة معهد ماساتشوستس للتكنولوجيا