تنزيل TarakoTalk - تنزيل رمز المصدر TarakoTalk

TarakoTalk

كود الذكاء الاصطناعي

TarakoTalk 1.0.0

تنزيل

Tarakotalk

لقطة شاشة

هذه أداة غير رسمية CLI TTS (نص إلى كلام) تتيح لهيرويوكي التحدث بأشياء مناسبة من CLI باستخدام صانع Ochari Hiroyuki.

سمات

إنه ينفذ سلستين فرعيتين: save ، والذي يحفظ الصوت الذي تم إنشاؤه إلى ملف ، play ، والذي يعزف الصوت الذي تم إنشاؤه كما هو على جهاز الكمبيوتر.

على عكس المواقع الإلكترونية التي يبلغ حجمها 140 حرفًا ، يسمح Tarakotalk Hiroyuki بالتحدث بنص ما يصل إلى 1000 حرف (استنادًا إلى مواصفات API اعتبارًا من 6 سبتمبر 2022).
يمكنك أيضًا نسخ ولصق أو جعل Hiroyuki قراءة القصص القصيرة بصوت عالٍ.
يبدو أن أقصر واحد يستغرق حوالي 5 ثوانٍ ، وما يصل إلى 15 ثانية لإنشاء الصوت (قد يكون أكثر إذا كان الخادم مشغولاً).

حفظ الصوت الذي تم إنشاؤه إلى ملف ( save )
- يمكن إدخال النص الذي تريد التحدث إليه من وسيطات سطر الأوامر أو الملفات النصية أو الإدخال القياسي (تمرير الأنابيب).
- احفظ الصوت الذي تم إنشاؤه بتنسيق WAV إلى مسار الملف المحدد
- يتم إخراج الصوت الذي تم إنشاؤه إلى الإخراج القياسي (من خلال الأنابيب) بتنسيق WAV.
  - إذا قمت بتثبيت FFMPEG بشكل منفصل ، فيمكنك التحويل من WAV إلى MP3 أو تنسيقات صوتية أخرى مع tarakotalk save "それって、あなたの感想ですよね？" "-" | ffmpeg -i - test.mp3 .
قم بتشغيل الصوت الذي تم إنشاؤه على جهاز الكمبيوتر الخاص بك ( play )
- يمكن إدخال النص الذي تريد التحدث إليه من وسيطات سطر الأوامر أو الملفات النصية أو الإدخال القياسي (تمرير الأنابيب).
- يتم تشغيل الصوت الذي تم إنشاؤه مباشرة من مكبر صوت الكمبيوتر (متوافق مع المنصات)

كيفية استخدام

قم بتنزيل أحدث Tarakotalk من الإصدارات ووضعها في المجلد حيث يمر مسارك.

Tarakotalk هي أداة Python ، لكنها مدمجة في ثنائي واحد باستخدام Nuitka.

Windows (x64): tarakotalk.exe
ماكوس (X64): Tarakotalk-Macos
- إنه فقط لإصدار Intel Mac ، ولكن يجب أن يعمل على MAC Apple Silicon (M1) إذا تم تضمين Rosetta 2 ...؟
Linux (X64): Tarakotalk-Linux
Linux (ARM64): Tarakotalk-Linux-Arm

هناك أربعة بنيات أعلاه. يرجى تنزيله وفقًا لنظام التشغيل الخاص بك.

 usage: ./tarakotalk [-h] {save,play} ...

Cross-platform CLI TTS Tools for Hiroyuki's Voice

positional arguments:
  {save,play}
    save       生成した音声をファイルに保存する
    play       生成した音声を PC 上で再生する

options:
  -h, --help   show this help message and exit

`tarakotalk save`

 usage: ./tarakotalk save [-h] input output

positional arguments:
  input       ひろゆきに喋らせるテキスト (文字列 or ファイルパス、"-" で標準入力から読み込み)
  output      生成した音声ファイル (wav) の保存先のファイルパス ("-" で標準出力に出力)

options:
  -h, --help  show this help message and exit

 # コマンドライン引数からテキストを入力し、生成した音声を /path/to/test.wav に保存
. / tarakotalk save "それって、あなたの感想ですよね？ " " /path/to/test.wav "

# ファイルからテキストを入力し、生成した音声を標準出力に出力したあと、FFmpeg に渡して mp3 に変換
. / tarakotalk save " /path/to/yoshinoya.txt " " - " | ffmpeg - i - - c:a libmp3lame / path / to / test.mp3

# 標準入力からテキストを読み上げ、生成した音声を /path/to/test.wav に保存
echo "それって、あなたの感想ですよね？ " | . / tarakotalk save " - " " /path/to/test.wav "

`tarakotalk play`

 usage: ./tarakotalk play [-h] input

positional arguments:
  input       ひろゆきに喋らせるテキスト (文字列 or ファイルパス、"-" で標準入力から読み込み)

options:
  -h, --help  show this help message and exit

 # コマンドライン引数からテキストを読み上げ
. / tarakotalk play "それって、あなたの感想ですよね？ "

# ファイルからテキストを読み上げ
. / tarakotalk play " /path/to/yoshinoya.txt "

# 標準入力からテキストを読み上げ
echo "それって、あなたの感想ですよね？ " | . / tarakotalk play " - "

أمثلة على الاستخدام

لقد أعطيت للتو مثالًا عشوائيًا يبدو أنه قابل للاستخدام في الوقت الحالي (المرجع المطلوب) ، ولم يتم التحقق منه ما إذا كان يمكن استخدامه بالفعل.

اطلب من هيرويوكي قراءة نسخة ولصق يوشينويا
اطلب منهم قراءة تعليقات من الدردشة الحية مثل Boyomi-chan
- ستحتاج إلى أداة منفصلة تتيح لك تنفيذ الأوامر مع محتوى التعليق عند تلقي تعليق من الدردشة المباشرة. لا أعرف ما إذا كان هناك شيء من هذا القبيل.
- حتى التعليقات القصيرة تستغرق بضع ثوان لتوليد الصوت ، لذلك سينخفض الأداء في الوقت الفعلي حتماً.
لقد قمت بتثبيت Tarakotalk على Raspberry Pi الخاص بي ودع Hiroyuki يقرأ الطقس وأخبار اليوم من المتحدث المتصل بـ Raspberry Pi في الساعة 8 صباحًا.
- يتم ترك الجيل (بالطبع) لخادم Coefont ، لذلك حتى الجهاز الضعيف مثل Raspberry Pi يجب أن يكون قادرًا على إنشاءه بسرعة إلى حد ما.
  - يمكن تشغيل الصوت الذي تم إنشاؤه على الإخراج القياسي ، لذلك إذا تلقيت الإدخال القياسي الذي تم تنشيطه من خلال FFMPEG ( -i - ) ، فيمكنك تحويله إلى تنسيق صوتي آخر أو تغيير سرعة التشغيل اعتمادًا على أمر FFMPEG.
  - يمكنك أيضًا استخدام FFMPEG لإضافة موسيقى خلفية أو تصفية الصوت.
استخدم الفيديو كرواية لقراءة هيرويوكي
- إذا كنت ترغب في استخدامه لإنشاء الفيديو ، يتم تضمين Hiroyuki رسميًا في Coefont ، وهو استخدام مجاني وغير محدود داخل Coefont Cloud ، لذلك أعتقد أنه من المناسب استخدام ذلك ، لأنه يتيح لك لعب التجويد والسرعة (لسبب ما لم يتم الإعلان عنه كثيرًا ...).
  - يجب تسجيل الدخول لاستخدام Coefont Cloud.
  - دفعت بعض Coefont عناصر ، ولكن يبدو أن Hiroyuki هي الطبقة الحرة ، بعد Arial Mial. الانخفاض ضخم ...
بالنسبة للمواد المجنونة الصوتية ، يتم إرسال كلمات الأغنية الأصلية إلى Hiroyuki ، ثم تدربها على الغناء بشكل منفصل في Reaper أو VocalShifter.
- نظرًا لأنها أداة CLI ، فمن الممكن إنشاء برنامج نصي Shell أو شيء لتقسيم الأغاني إلى ملفات WAV متعددة لإنشاءها.

تنصل

Tarakotalk هي أداة غير رسمية. لا علاقة له بمسؤول Coefont.
- يحصل Tarakotalk على صوت Hiroyuki من CLI من خلال الوصول مباشرة إلى واجهات برمجة التطبيقات الخاصة التي يستخدمها شركة Ochari Hiroyuki Maker.
- يرجى التوقف عن الاتصال بـ Coefont رسميًا حول Tarakotalk.
لا ضمان. ~~يرجى~~ استخدام Coefont رسميًا أو هيرويوكي نفسه كحل سري.
- لا يمكننا تحمل أي مسؤولية عن أي جرائم تنشأ من أي مكان. يرجى استخدامه على مسؤوليتك الخاصة.
- هذه ليست أداة جيدة في الأصل عند الوصول إلى واجهات برمجة التطبيقات الخاصة ، لذا يرجى التوقف عن استخدامها بطريقة تضع الكثير من الضغط على خوادم Coefont.
- نظرًا لأنه يتم التحقق من صحة كلمات NG على جانب API ، فإن الشيء نفسه ينطبق على كلمات NG ، سواء عبر Tarakotalk أم لا.
- هناك احتمال أن تصبح فجأة غير صالحة للاستعمال بسبب التغيرات في مواصفات API على جانب Coefont أو إنهاء الخدمة.