Descarga de Edge TTS - Descarga del código fuente de Edge TTS

Edge TTS

Código Fuente de IA

v1.0.0

Descargar

Bordes

Edge-TTS

Edge-TTS es una implementación rápida del servicio de texto a voz de Microsoft Edge (TTS). Esta biblioteca proporciona una interfaz API simple y fácil de usar que permite a los desarrolladores integrar la funcionalidad de texto a voz de alta calidad en aplicaciones de plataforma Apple.

日本語ドキュメント | 中文文档 | 한국어 문서

Características

Múltiples voces e idiomas

Más de 400 voces de redes neuronales
Soporte para más de 100 idiomas y variantes regionales
Efecto de síntesis del habla natural

Control de voz flexible

Tasa de voz ajustable (-50% a +100%)
Control de tono (-50Hz a +50Hz)
Control de volumen (-50% a +50%)
Selección de tipo de límite (oración/palabra)

Opciones de salida ricas

Soporte para la exportación de formatos mp3
Transmisión de síntesis del habla en tiempo real
Conversión asincrónica y reproducción
Exportación opcional de metadatos JSON
Exportación de subtítulos SRT opcional
Soporte de exportación de archivos multiplataforma (iOS/MacOS)

Herramientas de desarrollo

Herramienta de línea de comandos para pruebas rápidas y procesamiento por lotes
Aplicación GUI nativa con configuración visual
Documentación de API detallada y ejemplos de uso

Compatibilidad multiplataforma

macOS 13.0+
iOS/iPados 15.0+

Instalación

Administrador de paquetes Swift

Agregue la siguiente dependencia a su archivo paquete.swift:

dependencies: [
    . package ( url : " https://github.com/brewusinc/edge-tts.git " , from : " 1.0.0 " )
]

Comienzo rápido

Uso básico

import EdgeTTS

// Create TTS instance
let tts = EdgeTTS ( config : Configure (
    voice : " en-US-JennyNeural " ,
    rate : " +0% " ,
    pitch : " +0Hz " ,
    volume : " +0% " ,
    saveJSON : true ,  // Enable JSON metadata export
    saveSRT : true ,   // Enable SRT subtitle export
    boundaryType : . sentence  // Use sentence boundary (.word for word boundary)
) )

// Async conversion
Task {
    do {
        try await tts . ttsPromise ( text : " Hello, World! " , audioPath : " output.mp3 " )
        print ( " Conversion completed " )
    } catch {
        print ( " Conversion failed: ( error ) " )
    }
}

Uso de la herramienta de línea de comandos

La herramienta CLI proporciona dos comandos principales: list and speak .

Lista de voces disponibles

 # List all available voices
edge-tts-cli list

# List voices with proxy
edge-tts-cli list --proxy http://host:port

Convertir texto a discurso

 # Basic usage with text
edge-tts-cli speak --text " Hello, World! " --output hello.mp3

# Read text from file
edge-tts-cli speak --file input.txt --output hello.mp3

# Specify voice and language
edge-tts-cli speak --text " Hello, World! " --voice en-US-JennyNeural --lang en-US --output hello.mp3

# Adjust speech parameters
edge-tts-cli speak --text " Hello, World! " --rate +50% --pitch +10Hz --volume +20% --output hello.mp3

# Enable JSON and SRT export
edge-tts-cli speak --text " Hello, World! " --save-json --save-srt --output hello.mp3

# Set boundary type
edge-tts-cli speak --text " Hello, World! " --boundary word --output hello.mp3

# Use proxy
edge-tts-cli speak --text " Hello, World! " --proxy http://host:port --output hello.mp3

Opciones disponibles para el comando speak :

--text : texto para hablar
--file : ruta de archivo de texto de entrada
--voice : Voice to Use (predeterminado: en-us-jennyneural)
--lang : idioma para usar (predeterminado: en-us)
--rate : tasa de voz (por ejemplo, +0%, -10%)
--pitch : discurso (EG +0Hz, -10Hz)
--volume : volumen del habla (p. Ej. +0%, -10%)
--boundary : Tipo de límite (oración o palabra, predeterminado: oración)
--save-json : guarde la información de tiempo como JSON
--save-srt : Guardar información de sincronización como SRT
--proxy : url proxy (por ejemplo, http: // host: puerto)
--output : nombre de archivo de salida (predeterminado: output.mp3)

Uso de la aplicación GUI

Descargue e instale la última versión de la demostración de Edge TTS
Abra la aplicación e ingrese el texto que desea convertir
Seleccione la configuración deseada de voz y parámetros (velocidad, tono, volumen)
Habilitar la exportación JSON/SRT si es necesario
Elija el tipo de límite (oración o palabra)
Haga clic en el botón "Convertir y reproducir" para escuchar el discurso sintetizado
Use los botones de exportación para guardar archivos:
- En iOS: utiliza la hoja de compartir el sistema para el manejo flexible de archivos
- En macOS: utiliza el diálogo Guardar para elegir la ubicación de guardado

Características de exportación

Tipos de archivos

MP3: archivo de audio con discurso sintetizado
JSON: metadatos de tiempo para cada oración/palabra
SRT: archivo de subtítulo con marcas de tiempo

Exportación específica de la plataforma

iOS/iPados:
- Integración de la hoja de compartir el sistema
- Compartir a otras aplicaciones
- Soporte AirDrop
- Guardar en la aplicación Files
macOS:
- Diálogo Guardar nativo
- Elija Guardar ubicación
- Filtrado de tipo de archivo
- Manejo automático de extensión de archivos

Voces comunes

Puede obtener la lista de voces compatibles con:

 let voices = try await tts . fetchVoices ( )

Las voces populares en inglés incluyen:

en-us-jennyneural (mujer)
en-us-guyeural (hombre)
en-gb-sonianeural (mujer)
en-gb-ryanneural (hombre)
en-au-natashaneural (mujer)

Que contribuye

Damos la bienvenida a todas las formas de contribuciones, incluidas, entre otros::

Informes de errores y sugerencias de características
Mejoras en el código
Mejoras de documentación
Adiciones de los casos de prueba

Licencia

Este proyecto tiene licencia bajo la licencia MIT: consulte el archivo License.txt para obtener más detalles.

Expandir

Información adicional

Versión v1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-08-20
tamaño 157.5KB
Proviene de Github

Aplicaciones relacionadas

edge_installer

2024-11-04
F5 TTS ComfyUI

2024-11-02
Versión móvil de Android del navegador Edge

2023-10-30
Borde del espejo

2022-09-05
Eclipse: borde de luz

2022-08-17
Borde de la galaxia

2022-08-03

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo