Download de Edge TTS - Download de código -fonte Edge TTS

Edge TTS

Código-Fonte de IA

v1.0.0

Baixar

Edge-tts

Edge-TTS

O Edge-TTS é uma implementação rápida do serviço de texto em fala (TTS) da Microsoft Edge. Esta biblioteca fornece uma interface API simples e fácil de usar, que permite aos desenvolvedores integrar perfeitamente a funcionalidade de texto em expressão de alta qualidade nos aplicativos da plataforma Apple.

日本語ドキュメント | 中文文档 | 한국어 문서

Características

Várias vozes e idiomas

Mais de 400 vozes da rede neural
Suporte para mais de 100 idiomas e variantes regionais
Efeito de síntese de fala natural

Controle de voz flexível

Taxa de fala ajustável (-50% a +100%)
Controle de afinação (-50Hz a +50Hz)
Controle de volume (-50% a +50%)
Seleção de tipo de limite (frase/palavra)

Opções de saída ricas

Suporte para exportação de formato MP3
Streaming de síntese de fala em tempo real
Conversão assíncrona e reprodução
Exportação opcional de metadados json
Exportação opcional de legenda SRT
Suporte de exportação de arquivo de plataforma cruzada (iOS/macOS)

Ferramentas de desenvolvimento

Ferramenta de linha de comando para testes rápidos e processamento em lote
Aplicação da GUI nativa com configuração visual
Documentação detalhada da API e exemplos de uso

Compatibilidade entre plataformas

MacOS 13.0+
iOS/iPados 15.0+

Instalação

Gerente de pacotes Swift

Adicione a seguinte dependência ao seu arquivo package.swift:

dependencies: [
    . package ( url : " https://github.com/brewusinc/edge-tts.git " , from : " 1.0.0 " )
]

Início rápido

Uso básico

import EdgeTTS

// Create TTS instance
let tts = EdgeTTS ( config : Configure (
    voice : " en-US-JennyNeural " ,
    rate : " +0% " ,
    pitch : " +0Hz " ,
    volume : " +0% " ,
    saveJSON : true ,  // Enable JSON metadata export
    saveSRT : true ,   // Enable SRT subtitle export
    boundaryType : . sentence  // Use sentence boundary (.word for word boundary)
) )

// Async conversion
Task {
    do {
        try await tts . ttsPromise ( text : " Hello, World! " , audioPath : " output.mp3 " )
        print ( " Conversion completed " )
    } catch {
        print ( " Conversion failed: ( error ) " )
    }
}

Uso da ferramenta de linha de comando

A ferramenta CLI fornece dois comandos principais: list e speak .

Liste vozes disponíveis

 # List all available voices
edge-tts-cli list

# List voices with proxy
edge-tts-cli list --proxy http://host:port

Converter texto em fala

 # Basic usage with text
edge-tts-cli speak --text " Hello, World! " --output hello.mp3

# Read text from file
edge-tts-cli speak --file input.txt --output hello.mp3

# Specify voice and language
edge-tts-cli speak --text " Hello, World! " --voice en-US-JennyNeural --lang en-US --output hello.mp3

# Adjust speech parameters
edge-tts-cli speak --text " Hello, World! " --rate +50% --pitch +10Hz --volume +20% --output hello.mp3

# Enable JSON and SRT export
edge-tts-cli speak --text " Hello, World! " --save-json --save-srt --output hello.mp3

# Set boundary type
edge-tts-cli speak --text " Hello, World! " --boundary word --output hello.mp3

# Use proxy
edge-tts-cli speak --text " Hello, World! " --proxy http://host:port --output hello.mp3

Opções disponíveis para speak Command:

--text : texto para falar
--file : Caminho do arquivo de texto de entrada
--voice : Voice a usar (padrão: en-us-jenneural)
--lang : Idioma a usar (padrão: en-us)
--rate : taxa de fala (por exemplo, 0%, -10%)
--pitch : discurso de fala (por exemplo, 0Hz, -10Hz)
--volume : Volume da fala (por exemplo, 0%, -10%)
--boundary : tipo de limite (frase ou palavra, padrão: sentença)
--save-json : salve as informações de tempo como json
--save-srt : salve as informações de tempo como SRT
--proxy : URL proxy (por exemplo, http: // host: porta)
--output : Nome do arquivo de saída (padrão: output.mp3)

Uso do aplicativo da GUI

Baixe e instale a versão mais recente da Demo de Edge TTS
Abra o aplicativo e insira o texto que deseja converter
Selecione Configurações desejadas de voz e parâmetro (taxa, pitch, volume)
Ativar exportação JSON/SRT se necessário
Escolha o tipo de limite (frase ou palavra)
Clique no botão "Converter & play" para ouvir o discurso sintetizado
Use os botões de exportação para salvar arquivos:
- No iOS: usa a folha de compartilhamento do sistema para manuseio flexível de arquivos
- No macOS: usa a caixa de diálogo Salvar para escolher o local de salvar

Recursos de exportação

Tipos de arquivo

MP3: arquivo de áudio com fala sintetizada
JSON: Metadados de tempo para cada frase/palavra
SRT: arquivo de legenda com registro de data e hora

Exportação específica da plataforma

iOS/iPados:
- Integração da folha de ações do sistema
- Compartilhe com outros aplicativos
- Suporte Airdrop
- Salvar o aplicativo de arquivos
macos:
- Diálogo de salvar nativo
- Escolha Salvar localização
- Filtragem do tipo de arquivo
- Manipulação automática de extensão de arquivo

Vozes comuns

Você pode obter a lista de vozes suportadas usando:

 let voices = try await tts . fetchVoices ( )

As vozes populares em inglês incluem:

en-us-jenneural (feminino)
En-us-guyurural (masculino)
En-GB-Sonianeural (feminino)
en-gb-ryanneural (masculino)
en-ua-nathaneural (feminino)

Contribuindo

Congratulamo -nos com todas as formas de contribuições, incluindo, entre outros,:

Relatórios de bugs e sugestões de recursos
Melhorias de código
Melhorias de documentação
Adições de casos de teste

Licença

Este projeto está licenciado sob a licença do MIT - consulte o arquivo License.txt para obter detalhes.

Expandir

Informações adicionais

Versão v1.0.0
Tipo Código-Fonte de IA
Data da Última Atualização 2025-08-20
tamanho 157.5KB
Vindo de Github

Aplicativos Relacionados

edge_installer

2024-11-04
F5 TTS ComfyUI

2024-11-02
Versão móvel Android do navegador Edge

2023-10-30
Borda do Espelho

2022-09-05
Eclipse: Limite da Luz

2022-08-17
Borda da Galáxia

2022-08-03

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ML stack

Código-Fonte de IA

1.0.0
awesome free chatgpt

Código-Fonte de IA

1.0.0
pywin_contextmenu

Código-Fonte de IA

Version update
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos