
O Edge-TTS é uma implementação rápida do serviço de texto em fala (TTS) da Microsoft Edge. Esta biblioteca fornece uma interface API simples e fácil de usar, que permite aos desenvolvedores integrar perfeitamente a funcionalidade de texto em expressão de alta qualidade nos aplicativos da plataforma Apple.
日本語ドキュメント | 中文文档 | 한국어 문서
Adicione a seguinte dependência ao seu arquivo package.swift:
dependencies: [
. package ( url : " https://github.com/brewusinc/edge-tts.git " , from : " 1.0.0 " )
] import EdgeTTS
// Create TTS instance
let tts = EdgeTTS ( config : Configure (
voice : " en-US-JennyNeural " ,
rate : " +0% " ,
pitch : " +0Hz " ,
volume : " +0% " ,
saveJSON : true , // Enable JSON metadata export
saveSRT : true , // Enable SRT subtitle export
boundaryType : . sentence // Use sentence boundary (.word for word boundary)
) )
// Async conversion
Task {
do {
try await tts . ttsPromise ( text : " Hello, World! " , audioPath : " output.mp3 " )
print ( " Conversion completed " )
} catch {
print ( " Conversion failed: ( error ) " )
}
} A ferramenta CLI fornece dois comandos principais: list e speak .
# List all available voices
edge-tts-cli list
# List voices with proxy
edge-tts-cli list --proxy http://host:port # Basic usage with text
edge-tts-cli speak --text " Hello, World! " --output hello.mp3
# Read text from file
edge-tts-cli speak --file input.txt --output hello.mp3
# Specify voice and language
edge-tts-cli speak --text " Hello, World! " --voice en-US-JennyNeural --lang en-US --output hello.mp3
# Adjust speech parameters
edge-tts-cli speak --text " Hello, World! " --rate +50% --pitch +10Hz --volume +20% --output hello.mp3
# Enable JSON and SRT export
edge-tts-cli speak --text " Hello, World! " --save-json --save-srt --output hello.mp3
# Set boundary type
edge-tts-cli speak --text " Hello, World! " --boundary word --output hello.mp3
# Use proxy
edge-tts-cli speak --text " Hello, World! " --proxy http://host:port --output hello.mp3 Opções disponíveis para speak Command:
--text : texto para falar--file : Caminho do arquivo de texto de entrada--voice : Voice a usar (padrão: en-us-jenneural)--lang : Idioma a usar (padrão: en-us)--rate : taxa de fala (por exemplo, 0%, -10%)--pitch : discurso de fala (por exemplo, 0Hz, -10Hz)--volume : Volume da fala (por exemplo, 0%, -10%)--boundary : tipo de limite (frase ou palavra, padrão: sentença)--save-json : salve as informações de tempo como json--save-srt : salve as informações de tempo como SRT--proxy : URL proxy (por exemplo, http: // host: porta)--output : Nome do arquivo de saída (padrão: output.mp3)Você pode obter a lista de vozes suportadas usando:
let voices = try await tts . fetchVoices ( )As vozes populares em inglês incluem:
Congratulamo -nos com todas as formas de contribuições, incluindo, entre outros,:
Este projeto está licenciado sob a licença do MIT - consulte o arquivo License.txt para obter detalhes.