DOWNLOAD speech training recorder - DOWNLOAD DE speech training recorder CORDER

speech training recorder

Código-Fonte de IA

1.0.0

Baixar

Recordamento de treinamento de fala

Aplicação simples da GUI para ajudar a registrar o áudio ditado de determinados prompts de texto, para uso com o reconhecimento de fala ou a síntese de fala.

Dado um arquivo de texto que contém solicitações, este aplicativo escolherá uma seleção e pedidos aleatórias, exibirá -os para serem ditados pelo usuário e gravará o áudio e os metadados do ditado em um arquivo .wav e o arquivo recorder.tsv , respectivamente. Você pode selecionar uma gravação anterior para reproduzi-la, excluí-la e/ou regravar-a.

Captura de tela

Requisitos:

Python 3
Consulte requirements.txt para pacotes necessários
Plataforma cruzada: Windows, Linux, MacOS

Começando

 git clone https://github.com/daanzu/speech-training-recorder.git
cd speech-training-recorder
mkdir ../audio_data
pip install -r requirements.txt
python3 recorder.py -p prompts/timit.txt

 usage: recorder.py [-h] [-p PROMPTS_FILENAME] [-d SAVE_DIR] [-c PROMPTS_COUNT]
                   [-l PROMPT_LEN_SOFT_MAX] [-o]

Given a text file containing prompts, this app will choose a random selection
and ordering of them, display them to be dictated by the user, and record the
dictation audio and metadata to a `.wav` file and `recorder.tsv` file
respectively.

optional arguments:
  -h, --help            show this help message and exit
  -p PROMPTS_FILENAME, --prompts_filename PROMPTS_FILENAME
                        file containing prompts to choose from
  -d SAVE_DIR, --save_dir SAVE_DIR
                        where to save .wav & recorder.tsv files (default:
                        ../audio_data)
  -c PROMPTS_COUNT, --prompts_count PROMPTS_COUNT
                        number of prompts to select and display (default: 100)
  -l PROMPT_LEN_SOFT_MAX, --prompt_len_soft_max PROMPT_LEN_SOFT_MAX
  -o, --ordered         present prompts in order, as opposed to random
                        (default: False)

Personalização

Consulte prompts/ Diretório para obter formatos aceitáveis para arquivos imediatos: O mais simples é rainbow_passage.txt .

Repositórios relacionados

Daanzu/kaldi_ag_training: Imagem e scripts do Docker para o treinamento de modelos de fala Kaldi FinetUned ou completamente pessoais. Particularmente para uso com Kaldi-Active-Grammar.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-08-23
tamanho 165.47KB
Vindo de Github

Aplicativos Relacionados

GitHub sgrebnov/cordova plugin background download

2024-11-05
Gravador de tela

2024-04-07
Jogo APP de treinamento cerebral TBT (treinamento cerebral)

2023-12-06
Treinamento de reação do Wall Kicker

2023-11-01
Treinamento do Idol Dream Festival

2023-08-15
Treinamento de conjunto

2023-08-15

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos