Fale com o diálogo Chatgpt / Speaking
Apoie diferentes tipos de fala, Web, IA com centenas de sotaques (VCTK Corpus), apoiarão o Azure, Iflytek.
Apoie duas tecnologias de reconhecimento, Web e Iflytek.
Taylor, Robert Downey, converse com qualquer celebração, como Obama, Taylor, Downey ...
Oferecerá interface para carregar seu modelo TTS.
Classificação de avaliação / pronúncia de fala
Integre duas API de avaliação, SpeechSuper e Iflytek agora, aberto para obter melhores algoritmos para aperfeiçoar o recurso para o teste IELTS/TOEFL.
Chatgpt e Langhelper + Espeak-NG Instale a versão x86. ChatGPT e Langhelper estão instalados sem instalação e o Espeak-NG pode ser instalado por padrão. Tutorial em vídeo + tutorial de texto e precauções
Atualmente, para usar a pronúncia da IA, você precisa instalar o ChatGPT Desktop para Langhelper + Langhelper + Espeak-Ng. Como algumas bibliotecas usadas para executar a IA são relativamente grandes, desisti de programas Python de embalagem em arquivos de bin e integrando -os na área de trabalho do ChatGPT para Langhelper. Espeak-NG é uma dependência obrigatória para a síntese de fala.
Descompacte o pacote comprimido, uma pasta Langhelper (incluindo Langhelper.exe) e um chatgpt.exe, aberto, respectivamente. Langhelper aguardará a conclusão do ChatGPT antes de trabalhar. O ChatGPT definirá funções relacionadas à voz em -> Preferências -> Centro de Controle -> Configuração -> Langhelper. Sem a configuração da API, não selecione outros tipos de fala e reconhecimento. Após a conclusão das configurações, clique em Enviar e há um prompt de reinício para clicar em Sim. Esta é a janela Langhelper que aparecerá init -> Iniciar conversas, indicando que a inicialização é concluída.
A conversa não pode pronunciar a IA normalmente. Primeiro, clique no tentativa de testar se a pronúncia pode ser executada. Se o texto estiver vazio, a síntese padrão será "você é linda, eu te amo". Veja o que a interface Langhlper solicita. Erro: Obama, significa que o sotaque de Obama não pode ser usado e a outra razão é que o ambiente pode não ser bem configurado. Por favor, forneça informações detalhadas sobre capturas de tela ao enviar perguntas em um grupo. A seguir, a síntese, como posso ajudá -lo hoje? Promotos de informações normais:
Texto dividido em frases. ['Como posso ajudá -lo hoje?'] Olá! P241 Texto dividido em frases. ['Olá!'] Tempo de processamento: 0,8514664173126221 Fator em tempo real: 0,5273829916220033 Tempo de processamento: 0,6864285469055176 Factor em tempo real: 0,6285610240559246
Para reconhecimento de voz, você precisa clicar primeiro em reconhecimento de fala e depois clicar para encerrar o reconhecimento uma vez.
Como configurar avisos? Preferências -> Centro de Controle -> Modelo de Idioma -> Usuário Custom -> Modelo Adicionar, Adicione seus prompts personalizados, aqui está o meu ITelts Prompt for Reference:
I want you to ask me some questions for simulating IELTS speaking test, non official but give score of reference,when you ask me a question, I'll respond you my spoken text and prounciation scores which come from speech recognition and assessment tech, please remember that you should ask me question one by one it means that you should offer another question after I give you response text which includes prouncation scores, do not give questions one time because I do not want to respond it by one time, after all questions finished , you can Combine a pontuação para avaliar minha resposta, por favor, dê -me a pontuação final do teste de fala do IELTS. Então, vamos iniciar a primeira pergunta.
11.22 O OpenAI lançou uma função de conversa de voz completamente gratuita, que pode ser usada no não-plus: https://twitter.com/openai/status/1727065166188274145