Tarakotalk

Esta es una herramienta no oficial de CLI (texto a voz) que permite a Hiroyuki hablar cosas apropiadas del CLI usando el fabricante de Ochari Hiroyuki.
Características
Implementa dos subcomandos: save , que guarda el audio generado en un archivo, y play , que reproduce el audio generado como está en una PC.
A diferencia de los sitios web con un límite de 140 caracteres, Tarakotalk le permite a Hiroyuki hablar un texto de hasta 1000 caracteres (según las especificaciones de la API al 6 de septiembre de 2022).
También puede copiar y pegar o hacer que Hiroyuki lea historias cortas en voz alta.
Parece que el más corto tarda unos 5 segundos, y hasta 15 segundos para generar audio (puede ser más si el servidor está ocupado).
- Guardar audio generado en un archivo (
save )- El texto que desea hablar se puede ingresar desde argumentos de línea de comando, archivos de texto o entrada estándar (pasando por la tubería).
- Guardar el audio generado en formato WAV en la ruta de archivo especificada
- El audio generado se emite a la salida estándar (a través de la tubería) en formato WAV.
- Si instala FFMPEG por separado, puede convertir de WAV a MP3 u otros formatos de audio con
tarakotalk save "それって、あなたの感想ですよね?" "-" | ffmpeg -i - test.mp3 .
- Reproduce el audio generado en tu PC (
play )- El texto que desea hablar se puede ingresar desde argumentos de línea de comando, archivos de texto o entrada estándar (pasando por la tubería).
- El audio generado se reproduce directamente desde el altavoz PC (compatible con la plataforma cruzada)
Cómo usar
Descargue el último Tarakotalk de los lanzamientos y colóquelo en la carpeta donde pasa su camino.
Tarakotalk es una herramienta Python, pero está integrada en un solo binario usando Nuitka.
- Windows (x64): Tarakotalk.exe
- MacOS (x64): Tarakotalk-Macos
- Es solo para la versión Intel Mac, pero debería funcionar en una Mac de Silicon de Apple (M1) si Rosetta 2 está incluida ...?
- Linux (x64): Tarakotalk-Linux
- Linux (ARM64): Tarakotalk-Linux-Arm
Hay cuatro compilaciones arriba. Descárgalo de acuerdo con su sistema operativo.
usage: ./tarakotalk [-h] {save,play} ...
Cross-platform CLI TTS Tools for Hiroyuki's Voice
positional arguments:
{save,play}
save 生成した音声をファイルに保存する
play 生成した音声を PC 上で再生する
options:
-h, --help show this help message and exit
tarakotalk save
usage: ./tarakotalk save [-h] input output
positional arguments:
input ひろゆきに喋らせるテキスト (文字列 or ファイルパス、"-" で標準入力から読み込み)
output 生成した音声ファイル (wav) の保存先のファイルパス ("-" で標準出力に出力)
options:
-h, --help show this help message and exit
# コマンドライン引数からテキストを入力し、生成した音声を /path/to/test.wav に保存
. / tarakotalk save "それって、あなたの感想ですよね? " " /path/to/test.wav "
# ファイルからテキストを入力し、生成した音声を標準出力に出力したあと、FFmpeg に渡して mp3 に変換
. / tarakotalk save " /path/to/yoshinoya.txt " " - " | ffmpeg - i - - c:a libmp3lame / path / to / test.mp3
# 標準入力からテキストを読み上げ、生成した音声を /path/to/test.wav に保存
echo "それって、あなたの感想ですよね? " | . / tarakotalk save " - " " /path/to/test.wav "
tarakotalk play
usage: ./tarakotalk play [-h] input
positional arguments:
input ひろゆきに喋らせるテキスト (文字列 or ファイルパス、"-" で標準入力から読み込み)
options:
-h, --help show this help message and exit
# コマンドライン引数からテキストを読み上げ
. / tarakotalk play "それって、あなたの感想ですよね? "
# ファイルからテキストを読み上げ
. / tarakotalk play " /path/to/yoshinoya.txt "
# 標準入力からテキストを読み上げ
echo "それって、あなたの感想ですよね? " | . / tarakotalk play " - "
Ejemplos de uso
Acabo de dar un ejemplo aleatorio que parece ser utilizable por ahora (requerido referencia), y no se ha verificado si realmente se puede usar.
- Haga que Hiroyuki lea una copia y pegue de Yoshinoya
- Haga que lean comentarios del chat en vivo como boyomi-chan
- Necesitará una herramienta separada que le permita ejecutar comandos junto con el contenido de comentarios cuando reciba un comentario del chat en vivo. No sé si hay algo así.
- Incluso los comentarios cortos tardan unos segundos en generar audio, por lo que el rendimiento en tiempo real disminuirá inevitablemente.
- Instalé Tarakotalk en mi Raspberry Pi y dejé que Hiroyuki leyera el clima y las noticias de hoy desde el altavoz conectado a mi Raspberry Pi a las 8 a.m.
- La generación se deja (por supuesto) al servidor de CoeFont, por lo que incluso una máquina débil como Raspberry Pi debería poder generarla con bastante rapidez.
- El audio generado se puede reproducir en salida estándar, por lo que si recibe la entrada estándar que se ha recibido a través de FFMPEG (
-i - ), puede convertirla a otro formato de audio o cambiar la velocidad de reproducción dependiendo del comando FFMPEG. - También puede usar FFMPEG para agregar música de fondo o filtrar el audio.
- Usa el video como narración para leer Hiroyuki
- Si desea usarlo para la creación de video, Hiroyuki se incluye oficialmente en CoeFont, que es de uso gratuito e ilimitado dentro de CoeFont Cloud, por lo que creo que es más conveniente usar eso, ya que le permite jugar una entonación y velocidad (por alguna razón, no se anuncia mucho ...).
- Debe iniciarse para usar COEFONT CLOUW.
- Algunos coeficientes han pagado artículos, pero Hiroyuki parece ser el nivel libre, siguiendo a Arial Mial. La gota es enorme ...
- Para los materiales de Sound Mad, la letra de la canción original se envía a Hiroyuki, y luego se entrenan y se hacen cantar por separado en Reaper o Vocalshifter.
- Dado que es una herramienta CLI, es posible crear un script de shell o algo para dividir la letra en múltiples archivos WAV para generarlos.
Descargo de responsabilidad
- Tarakotalk es una herramienta no oficial. No tiene nada que ver con el funcionario de la coeficiente.
- Tarakotalk obtiene el audio de Hiroyuki del CLI accediendo directamente a las API privadas utilizadas internamente por Ochari Hiroyuki Maker.
- Por favor, deje de contactar a CoeFont oficialmente sobre Tarakotalk.
- Sin garantía.
Utilice CoeFont oficialmente o el propio Hiroyuki como una solución secreta.- No podemos asumir ninguna responsabilidad por ningún delito que surja de cualquier lugar. Úselo bajo su propio riesgo.
- Esta no es una herramienta que originalmente es algo bueno cuando se accede a API privadas, así que deje de usarla de una manera que ponga demasiado tensión en los servidores coeficientes.
- Debido a que las palabras ng se validan en el lado de la API, lo mismo se aplica a las palabras ng, ya sea a través de Tarakotalk o no.
- Existe la posibilidad de que de repente se vuelva inutilizable debido a los cambios en las especificaciones de la API en el lado coeficiente o en la terminación del servicio.
Licencia
Licencia de MIT