Tarakotalk

Esta é uma ferramenta de cli tts (texto em fala) que permite que Hiroyuki fale coisas apropriadas da CLI usando o Ochari Hiroyuki Maker.
Características
Ele implementa dois subcomando: save , que salva o áudio gerado em um arquivo e play , que reproduz o áudio gerado como está em um PC.
Ao contrário dos sites com um limite de 140 caracteres, Tarakotalk permite que Hiroyuki fale texto até 1000 caracteres (com base nas especificações da API em 6 de setembro de 2022).
Você também pode copiar e colar ou fazer Hiroyuki ler histórias curtas em voz alta.
Parece que o mais curto leva cerca de 5 segundos e até 15 segundos para gerar áudio (pode ser mais se o servidor estiver ocupado).
- Salvar áudio gerado para um arquivo (
save )- O texto que você deseja ser falado pode ser inserido a partir de argumentos da linha de comando, arquivos de texto ou entrada padrão (passando pelo tubo).
- Salve o áudio gerado em formato WAV no caminho do arquivo especificado
- O áudio gerado é emitido para saída padrão (através do tubo) no formato WAV.
- Se você instalar o FFMPEG separadamente, poderá converter do WAV para MP3 ou outros formatos de áudio com
tarakotalk save "それって、あなたの感想ですよね?" "-" | ffmpeg -i - test.mp3 .
- Jogue o áudio gerado no seu PC (
play )- O texto que você deseja ser falado pode ser inserido a partir de argumentos da linha de comando, arquivos de texto ou entrada padrão (passando pelo tubo).
- O áudio gerado é reproduzido diretamente no alto-falante do PC (compatível com plataforma cruzada)
Como usar
Faça o download dos mais recentes Tarakotalk dos lançamentos e coloque -o na pasta onde seu caminho passa.
O Tarakotalk é uma ferramenta Python, mas é incorporada em um único binário usando Nuitka.
- Windows (x64): Tarakotalk.exe
- MacOS (x64): Tarakotalk-Macos
- É apenas para a versão Intel Mac, mas deve funcionar em um Mac Apple Silicon (M1) se o Rosetta 2 estiver incluído ...?
- Linux (x64): Tarakotalk-Linux
- Linux (ARM64): Tarakotalk-Linux-Arm
Existem quatro construções acima. Faça o download de acordo com o seu sistema operacional.
usage: ./tarakotalk [-h] {save,play} ...
Cross-platform CLI TTS Tools for Hiroyuki's Voice
positional arguments:
{save,play}
save 生成した音声をファイルに保存する
play 生成した音声を PC 上で再生する
options:
-h, --help show this help message and exit
tarakotalk save
usage: ./tarakotalk save [-h] input output
positional arguments:
input ひろゆきに喋らせるテキスト (文字列 or ファイルパス、"-" で標準入力から読み込み)
output 生成した音声ファイル (wav) の保存先のファイルパス ("-" で標準出力に出力)
options:
-h, --help show this help message and exit
# コマンドライン引数からテキストを入力し、生成した音声を /path/to/test.wav に保存
. / tarakotalk save "それって、あなたの感想ですよね? " " /path/to/test.wav "
# ファイルからテキストを入力し、生成した音声を標準出力に出力したあと、FFmpeg に渡して mp3 に変換
. / tarakotalk save " /path/to/yoshinoya.txt " " - " | ffmpeg - i - - c:a libmp3lame / path / to / test.mp3
# 標準入力からテキストを読み上げ、生成した音声を /path/to/test.wav に保存
echo "それって、あなたの感想ですよね? " | . / tarakotalk save " - " " /path/to/test.wav "
tarakotalk play
usage: ./tarakotalk play [-h] input
positional arguments:
input ひろゆきに喋らせるテキスト (文字列 or ファイルパス、"-" で標準入力から読み込み)
options:
-h, --help show this help message and exit
# コマンドライン引数からテキストを読み上げ
. / tarakotalk play "それって、あなたの感想ですよね? "
# ファイルからテキストを読み上げ
. / tarakotalk play " /path/to/yoshinoya.txt "
# 標準入力からテキストを読み上げ
echo "それって、あなたの感想ですよね? " | . / tarakotalk play " - "
Exemplos de uso
Acabei de dar um exemplo aleatório que parece ser utilizável por enquanto (referência necessária) e não foi verificada se ele pode realmente ser usado.
- Hiroyuki leem uma cópia e colar de Yoshinoya
- Peça aos comentários de leitura do bate-papo ao vivo como Boyomi-chan
- Você precisará de uma ferramenta separada que permita executar comandos junto com o conteúdo do comentário ao receber um comentário do bate -papo ao vivo. Não sei se há algo assim.
- Mesmo comentários curtos levam alguns segundos para gerar áudio, portanto, o desempenho em tempo real diminuirá inevitavelmente.
- Instalei Tarakotalk no meu Raspberry Pi e deixei Hiroyuki ler o clima e as notícias de hoje do orador conectado ao meu Raspberry Pi às 8h.
- A geração é (é claro) deixada para o servidor de Coefont; portanto, mesmo uma máquina fraca como o Raspberry Pi deve ser capaz de gerá -lo rapidamente.
- O áudio gerado pode ser reproduzido na saída padrão; portanto, se você receber a entrada padrão que foi canalizada através do FFMPEG (
-i - ), poderá convertê -lo em outro formato de áudio ou alterar a velocidade de reprodução, dependendo do comando FFMPEG. - Você também pode usar o FFMPEG para adicionar música de fundo ou filtrar o áudio.
- Use o vídeo como narração para ler Hiroyuki
- Se você deseja usá -lo para criação de vídeo, o Hiroyuki está oficialmente incluído no Coefont, que é um uso gratuito e ilimitado na Coefont Cloud, então acho que é mais conveniente usar isso, pois permite que você jogue entonação e velocidade (por algum motivo, não é muito anunciado ...).
- Você deve estar conectado para usar o Coefont Cloud.
- Alguns Coefont pagaram itens, mas Hiroyuki parece ser o nível livre, seguindo o Arial Mial. A queda é enorme ...
- Para os materiais loucos, as letras da música original são enviadas para Hiroyuki e depois treinadas e feitas para cantar separadamente em Ceifador ou Vocalshifter.
- Como é uma ferramenta da CLI, é possível criar um script de shell ou algo para dividir a letra em vários arquivos WAV para gerá -los.
Isenção de responsabilidade
- Tarakotalk é uma ferramenta não oficial. Não tem nada a ver com o funcionário de Coefont.
- Tarakotalk recebe o áudio de Hiroyuki da CLI acessando diretamente as APIs privadas usadas internamente pela fabricante de Ochari Hiroyuki.
- Por favor, pare de entrar em contato oficialmente com Coefont sobre Tarakotalk.
- Sem garantia.
Por favor, use Coefont oficialmente ou o próprio Hiroyuki como uma solução secreta.- Não podemos assumir qualquer responsabilidade por qualquer ofensa que surja de qualquer lugar. Por favor, use -o por sua conta e risco.
- Esta não é uma ferramenta que é originalmente uma coisa boa ao acessar APIs privadas; portanto, pare de usá -la de uma maneira que coloque muita pressão nos servidores Coefont.
- Como as palavras NG são validadas no lado da API, o mesmo se aplica a palavras NG, seja via Tarakotalk ou não.
- Existe a possibilidade de que isso se torne repentinamente inutilizável devido a alterações nas especificações da API no lado de Coefont ou no término do serviço.
Licença
MIT Licença