
Edge-TTS es una implementación rápida del servicio de texto a voz de Microsoft Edge (TTS). Esta biblioteca proporciona una interfaz API simple y fácil de usar que permite a los desarrolladores integrar la funcionalidad de texto a voz de alta calidad en aplicaciones de plataforma Apple.
日本語ドキュメント | 中文文档 | 한국어 문서
Agregue la siguiente dependencia a su archivo paquete.swift:
dependencies: [
. package ( url : " https://github.com/brewusinc/edge-tts.git " , from : " 1.0.0 " )
] import EdgeTTS
// Create TTS instance
let tts = EdgeTTS ( config : Configure (
voice : " en-US-JennyNeural " ,
rate : " +0% " ,
pitch : " +0Hz " ,
volume : " +0% " ,
saveJSON : true , // Enable JSON metadata export
saveSRT : true , // Enable SRT subtitle export
boundaryType : . sentence // Use sentence boundary (.word for word boundary)
) )
// Async conversion
Task {
do {
try await tts . ttsPromise ( text : " Hello, World! " , audioPath : " output.mp3 " )
print ( " Conversion completed " )
} catch {
print ( " Conversion failed: ( error ) " )
}
} La herramienta CLI proporciona dos comandos principales: list and speak .
# List all available voices
edge-tts-cli list
# List voices with proxy
edge-tts-cli list --proxy http://host:port # Basic usage with text
edge-tts-cli speak --text " Hello, World! " --output hello.mp3
# Read text from file
edge-tts-cli speak --file input.txt --output hello.mp3
# Specify voice and language
edge-tts-cli speak --text " Hello, World! " --voice en-US-JennyNeural --lang en-US --output hello.mp3
# Adjust speech parameters
edge-tts-cli speak --text " Hello, World! " --rate +50% --pitch +10Hz --volume +20% --output hello.mp3
# Enable JSON and SRT export
edge-tts-cli speak --text " Hello, World! " --save-json --save-srt --output hello.mp3
# Set boundary type
edge-tts-cli speak --text " Hello, World! " --boundary word --output hello.mp3
# Use proxy
edge-tts-cli speak --text " Hello, World! " --proxy http://host:port --output hello.mp3 Opciones disponibles para el comando speak :
--text : texto para hablar--file : ruta de archivo de texto de entrada--voice : Voice to Use (predeterminado: en-us-jennyneural)--lang : idioma para usar (predeterminado: en-us)--rate : tasa de voz (por ejemplo, +0%, -10%)--pitch : discurso (EG +0Hz, -10Hz)--volume : volumen del habla (p. Ej. +0%, -10%)--boundary : Tipo de límite (oración o palabra, predeterminado: oración)--save-json : guarde la información de tiempo como JSON--save-srt : Guardar información de sincronización como SRT--proxy : url proxy (por ejemplo, http: // host: puerto)--output : nombre de archivo de salida (predeterminado: output.mp3)Puede obtener la lista de voces compatibles con:
let voices = try await tts . fetchVoices ( )Las voces populares en inglés incluyen:
Damos la bienvenida a todas las formas de contribuciones, incluidas, entre otros::
Este proyecto tiene licencia bajo la licencia MIT: consulte el archivo License.txt para obtener más detalles.