Tarakotalk

Il s'agit d'un outil non officiel de CLI TTS (text-vocation) qui permet à Hiroyuki de parler des choses appropriées de la CLI à l'aide d'Ochari Hiroyuki Maker.
Caractéristiques
Il implémente deux sous-communs: save , qui enregistre l'audio généré dans un fichier, et play , qui lit l'audio généré tel quel sur un PC.
Contrairement aux sites Web avec une limite de 140 caractères, Tarakotalk permet à Hiroyuki de parler du texte jusqu'à 1000 caractères (basé sur les spécifications de l'API au 6 septembre 2022).
Vous pouvez également copier et coller ou demander à Hiroyuki de lire des histoires courtes à haute voix.
Il semble que le plus court prenne environ 5 secondes et jusqu'à 15 secondes pour générer de l'audio (peut être plus si le serveur est occupé).
- Enregistrer l'audio généré dans un fichier (
save )- Le texte que vous souhaitez parler peut être entré à partir d'arguments de ligne de commande, de fichiers texte ou d'entrée standard (passant par le tuyau).
- Enregistrez l'audio généré au format WAV sur le chemin du fichier spécifié
- L'audio généré est sorti à la sortie standard (via le tuyau) au format WAV.
- Si vous installez FFMPEG séparément, vous pouvez convertir de WAV en MP3 ou d'autres formats audio avec
tarakotalk save "それって、あなたの感想ですよね?" "-" | ffmpeg -i - test.mp3 .
- Jouez à l'audio généré sur votre PC (
play )- Le texte que vous souhaitez parler peut être entré à partir d'arguments de ligne de commande, de fichiers texte ou d'entrée standard (passant par le tuyau).
- L'audio généré est joué directement à partir du haut-parleur PC (compatible de plate-forme multiplié)
Comment utiliser
Téléchargez le dernier Tarakotalk à partir des versions et placez-la dans le dossier où votre chemin passe.
Tarakotalk est un outil Python, mais il est intégré à un seul binaire à l'aide de Nuitka.
- Windows (x64): tarakotalk.exe
- macOS (x64): Tarakotalk-macos
- C'est uniquement pour la version Intel Mac, mais cela devrait fonctionner sur un Mac Apple Silicon (M1) si Rosetta 2 est incluse ...?
- Linux (x64): Tarakotalk-Linux
- Linux (ARM64): Tarakotalk-Linux-Arm
Il y a quatre constructions ci-dessus. Veuillez le télécharger en fonction de votre système d'exploitation.
usage: ./tarakotalk [-h] {save,play} ...
Cross-platform CLI TTS Tools for Hiroyuki's Voice
positional arguments:
{save,play}
save 生成した音声をファイルに保存する
play 生成した音声を PC 上で再生する
options:
-h, --help show this help message and exit
tarakotalk save
usage: ./tarakotalk save [-h] input output
positional arguments:
input ひろゆきに喋らせるテキスト (文字列 or ファイルパス、"-" で標準入力から読み込み)
output 生成した音声ファイル (wav) の保存先のファイルパス ("-" で標準出力に出力)
options:
-h, --help show this help message and exit
# コマンドライン引数からテキストを入力し、生成した音声を /path/to/test.wav に保存
. / tarakotalk save "それって、あなたの感想ですよね? " " /path/to/test.wav "
# ファイルからテキストを入力し、生成した音声を標準出力に出力したあと、FFmpeg に渡して mp3 に変換
. / tarakotalk save " /path/to/yoshinoya.txt " " - " | ffmpeg - i - - c:a libmp3lame / path / to / test.mp3
# 標準入力からテキストを読み上げ、生成した音声を /path/to/test.wav に保存
echo "それって、あなたの感想ですよね? " | . / tarakotalk save " - " " /path/to/test.wav "
tarakotalk play
usage: ./tarakotalk play [-h] input
positional arguments:
input ひろゆきに喋らせるテキスト (文字列 or ファイルパス、"-" で標準入力から読み込み)
options:
-h, --help show this help message and exit
# コマンドライン引数からテキストを読み上げ
. / tarakotalk play "それって、あなたの感想ですよね? "
# ファイルからテキストを読み上げ
. / tarakotalk play " /path/to/yoshinoya.txt "
# 標準入力からテキストを読み上げ
echo "それって、あなたの感想ですよね? " | . / tarakotalk play " - "
Exemples d'utilisation
Je viens de donner un exemple aléatoire qui semble être utilisable pour l'instant (référence requise), et il n'a pas été vérifié s'il peut réellement être utilisé.
- Demandez à Hiroyuki de lire une copie et de coller de Yoshinoya
- Faites-les lire les commentaires de Live Chat comme Boyomi-chan
- Vous aurez besoin d'un outil séparé qui vous permet d'exécuter des commandes ainsi que le contenu de commentaire lorsque vous recevez un commentaire de Live Chat. Je ne sais pas s'il y a quelque chose comme ça.
- Même les courts commentaires prennent quelques secondes pour générer de l'audio, donc les performances en temps réel diminueront inévitablement.
- J'ai installé Tarakotalk sur mon Raspberry Pi et j'ai laissé Hiroyuki lire la météo et les nouvelles d'aujourd'hui de l'orateur connecté à mon Raspberry Pi à 8h du matin.
- La génération est (bien sûr) laissée au serveur de Coefont, donc même une machine faible comme Raspberry Pi devrait être en mesure de le générer assez rapidement.
- L'audio généré peut être lu à la sortie standard, donc si vous recevez l'entrée standard qui a été canalisée via FFMPEG (
-i - ), vous pouvez la convertir en un autre format audio ou modifier la vitesse de lecture en fonction de la commande ffmpeg. - Vous pouvez également utiliser FFMPEG pour ajouter de la musique de fond ou filtrer l'audio.
- Utilisez la vidéo comme narration pour lire Hiroyuki
- Si vous souhaitez l'utiliser pour la création de vidéos, Hiroyuki est officiellement inclus dans CoeFont, qui est une utilisation gratuite et illimitée dans CoeFont Cloud, donc je pense qu'il est plus pratique de l'utiliser, car il vous permet de jouer à l'intonation et à la vitesse (pour une raison quelconque, ce n'est pas beaucoup annoncé ...).
- Vous devez être connecté pour utiliser CoEfont Cloud.
- Certains coefont ont payé des articles, mais Hiroyuki semble être le niveau gratuit, après Arial Mial. La goutte est énorme ...
- Pour Sound Mad Materials, les paroles de la chanson originale sont envoyées à Hiroyuki, puis formées et faites pour chanter séparément dans Reaper ou Vocalshifter.
- Puisqu'il s'agit d'un outil CLI, il est possible de créer un script shell ou quelque chose pour diviser les paroles en plusieurs fichiers WAV pour les générer.
Clause de non-responsabilité
- Tarakotalk est un outil non officiel. Cela n'a rien à voir avec le responsable de Coefont.
- Tarakotalk obtient l'audio d'Hiroyuki de la CLI en accédant directement aux API privées utilisées en interne par Ochari Hiroyuki Maker.
- Veuillez arrêter de contacter officiellement Coefont à propos de Tarakotalk.
- Aucune garantie.
Veuillez utiliser Coefont officiellement ou Hiroyuki lui-même comme solution secrète.- Nous ne pouvons assumer aucune responsabilité pour les infractions qui découlent de n'importe où. Veuillez l'utiliser à vos propres risques.
- Ce n'est pas un outil qui est à l'origine une bonne chose lors de l'accès aux API privées, alors veuillez cesser de l'utiliser d'une manière qui met trop de pression sur les serveurs CoEfont.
- Parce que les mots ng sont validés du côté API, il en va de même pour les mots ng, que ce soit via Tarakotalk ou non.
- Il est possible qu'il puisse soudainement devenir inutilisable en raison de changements dans les spécifications de l'API du côté coefont ou de la fin du service.
Licence
Licence MIT