
Inglês |
Awesome-Chattts é um projeto de resumo de recursos de chattts oficialmente recomendado.
Se você acha que este projeto é útil para você entender e usar chattts, dê -me algumas recompensas e apoio.
Observação
Os seguintes projetos são recursos da comunidade.
| Site | tipo |
|---|---|
| Web original | Experiência original da versão da web |
| Forge web | Forge Forge Enhanced Edition Experience |
| Linux | Pacote de instalação do Python |
| Amostras | Exemplo de semente de tom |
| Clonagem | Experiência de clonagem de tom |
| projeto | Estrela | Destaques |
|---|---|---|
| jianchang512/chattts-ui | Fornece interface API que pode ser chamada em aplicativos de terceiros | |
| 6DRF21E/CHATTTS_COLAB | Forneça saída de streaming, suporte a geração de áudio longa e leitura de caracteres parcial | |
| Lenml/Chattts-Forge | Fornece aprimoramento vocal e redução de ruído de fundo, com palavras rápidas adicionais disponíveis | |
| CCMAHua/Chattts-aprimorou | Suporta o processamento em lote de arquivos e exportações de arquivos SRT | |
| HKOON/CHATTTS-OpenVoice | Clonagem de som com openvoice |
| projeto | Estrela | Destaques |
|---|---|---|
| 6drf21e/chattts_speaker | Tone Caractere marcação e avaliação de estabilidade | |
| AIFSH/COMFYUI-CHATTTS | Versão confortyui, que pode ser introduzida como um nó de fluxo de trabalho | |
| Materialshadow/Chattts-manager | Fornece um sistema de gerenciamento de tons e interface webui |

Após o .pt real, há uma diferença significativa no efeito de gerar spk_emb cada vez que o valor de semente de tom especificado é gerado e reutilizando spk_emb pré-gerado.
As sementes de tom foram inicialmente marcadas e a avaliação estável no projeto Chattts_Speaker, e o tom certo pode ser selecionado rapidamente por meio de exemplos.

Quando usado no webui oficial, você pode copiar diretamente o código de tom e substituir o valor em 9. Speaker Embedding para obter controle de tom.
Quando usado em scripts Python, consulte o esquema de compactação na edição nº 07 para obter o controle de tom.
spk = torch . load ( "asset/seed_1332_restored_emb.pt" , map_location = torch . device ( 'cpu' )). detach ()
spk_emb_str = compress_and_encode ( spk )
params_infer_code = ChatTTS . Chat . InferCodeParams (
spk_emb = spk_emb_str , # add sampled speaker
temperature = .0003 , # using custom temperature
top_P = 0.7 , # top P decode
top_K = 20 , # top K decode
)| vídeo | Destaques |
|---|---|
| Irmão Tongji Zihao | Tutorial detalhado de implantação da entrada para avançado |
| Ztfs | Tutorial de implantação Mac M1 |
| King - Bao Bao | Tutorial de implantação do Windows |
| vídeo | Destaques |
|---|---|
| Sam Witteveen | Introdução à versão em inglês |
Após iterações recentes, os problemas no código do repositório de origem foram basicamente resolvidos. Se você encontrar problemas, é recomendável verificar a versão chinesa do documento de descrição oficial em detalhes primeiro.
O projeto original precisa fazer o download do modelo correspondente do HuggingFace. Como alternativa, você pode baixar o modelo e a configuração do ModelCope e configurar o caminho local.
Importante
A biblioteca de modelos na torre mágica é mantida por voluntários e não garante que todos os modelos estejam atualizados.
pip install modelscope # 在开头导入依赖,并下载模型和配置
from modelscope import snapshot_download
model_dir = snapshot_download ( 'zlj2546/ChatTTS' )
# 第 118 行修改模型路径
ret = chat . load_models ( 'custom' , custom_path = model_dir )Ao executar no IDE, o script não pode ser executado sem problemas devido ao caminho relativo do arquivo.
Recomenda -se consultar as instruções na inicialização rápida da documentação oficial e executá -la diretamente no terminal.
Verifique se você está no diretório raiz do projeto ao executar o seguinte comando.
python examples/web/webui.pyO áudio gerado será salvo para
./output_audio_n.mp3
python examples/cmd/run.py " Your text 1. " " Your text 2. " Esse problema ocorre porque o código oficial não cobre o tempo todo ao lidar com a pontuação chinesa, por exemplo ? Símbolos como, … não são processados, resultando em um erro durante a geração do modelo.
Você pode excluir manualmente marcas de pontuação chinesa semelhantes ou modificar o código em ChatTTS/utils/infer_utils.py para adicionar pontos de pontuação ausentes ao dicionário de character_map nas linhas 103.
character_map = {
'…' : '' ,
'—' : ',' ,
'_' : ',' ,
'?' : ',' ,
}A GPU requer pelo menos a memória de vídeo 4G, caso contrário, a CPU será usada.
1. load_models() got an unexpected keyword argument 'source'
Veja as perguntas frequentes para obter detalhes - o modelo não pode ser baixado
2. cannot import name 'CommitOperationAdd' from 'huggingface_hub'
Veja as perguntas frequentes para obter detalhes - o modelo não pode ser baixado
3. FileNotFoundError:[Erzno 2] No such file or directory: 'C:\Users\xxx\.cache\huggingface\hub\models--2Noise--ChatTTS\snapshots
Veja as perguntas frequentes para obter detalhes - o modelo não pode ser baixado
4. local variable 'Normalizer' referenced before assignment
Você precisa instalar dependências pynini e WeTextProcessing após concluir a configuração do ambiente.
conda install -c conda-forge pynini=2.1.5 && pip install WeTextProcessing 5. download to Local path D:pythonlprojectChatTTSChatTTS failed.
Execute os scripts diretamente no IDE e um erro será relatado devido a problemas do caminho do arquivo.
6. ModuleNotFoundError : No module named'Cython'
O caminho de execução do Python não é encontrado, os dispositivos Windows precisam configurar o caminho do ambiente de acordo com o tutorial