edge tts as a service Download - edge tts as a service Source Code Téléchargement

edge tts as a service

Code Source AI

1.0.0

Télécharger

Service HTTP Edge-Tts

Un service HTTP simple qui fournit des fonctionnalités de texte vocale à l'aide du moteur TTS de Microsoft Edge, prenant en charge plusieurs langages et voix via des API RESTFul.

Anglais | 中文

Caractéristiques

? Support de plusieurs langues et voix
Sortie audio en streaming et non streaming
? Interface API de repos simple
? Support Docker
⚡ Réponse de latence faible

Démarrage rapide

Option 1: Exécutez directement

Clone le référentiel:

git clone https://github.com/doctoroyy/edge-tts-as-a-service
cd edge-tts-as-a-service

Installez les dépendances:

pip install -r requirements.txt

Démarrer le service:

python main.py

Le service sera disponible sur http://localhost:5000

Option 2: déploiement de Docker

Construisez l'image:

docker build -t edge-tts-as-a-service .

Exécutez le conteneur:

docker run -d -p 5000:5000 edge-tts-as-a-service

Documentation API

1. Liste des voix disponibles

Récupérez toutes les options vocales prises en charge.

 GET /voices

Exemple de réponse:

{
    "code" : 200 ,
    "message" : " OK " ,
    "data" : [
        {
            "Name" : " en-US-GuyNeural " ,
            "ShortName" : " en-US-GuyNeural " ,
            "Gender" : " Male " ,
            "Locale" : " en-US "
        },
        // ... more voices
    ]
}

2. Texte à dispection (téléchargement)

Convertissez le texte en parole et téléchargez le fichier audio.

 POST /tts

Corps de demande:

{
    "text" : " Hello, World! " ,
    "voice" : " en-US-GuyNeural " ,    // Optional, defaults to "zh-CN-YunxiNeural"
    "file_name" : " hello.mp3 "       // Optional, defaults to "test.mp3"
}

Réponse:

Type de contenu: Audio / MPEG
Renvoie un flux de fichiers audio

3. Texte à dispection (streaming)

Convertissez du texte en discours avec sortie de streaming, adapté à la lecture en temps réel.

 POST /tts/stream

Corps de demande:

{
    "text" : " Hello, World! " ,
    "voice" : " en-US-GuyNeural "    // Optional, defaults to "zh-CN-YunxiNeural"
}

Réponse:

Type de contenu: application / trace d'octet
Renvoie un flux audio

Exemples d'utilisation

Exemple Python

 import requests

# Get available voices
response = requests . get ( 'http://localhost:5000/voices' )
voices = response . json ()[ 'data' ]

# Text-to-Speech (Download)
data = {
    "text" : "Hello, World!" ,
    "voice" : "en-US-GuyNeural" ,
    "file_name" : "output.mp3"
}
response = requests . post ( 'http://localhost:5000/tts' , json = data )
with open ( 'output.mp3' , 'wb' ) as f :
    f . write ( response . content )

# Text-to-Speech (Streaming)
response = requests . post ( 'http://localhost:5000/tts/stream' , json = data , stream = True )
with open ( 'stream_output.mp3' , 'wb' ) as f :
    for chunk in response . iter_content ( chunk_size = 8192 ):
        f . write ( chunk )

Curl Exemple

 # Get available voices
curl http://localhost:5000/voices

# Text-to-Speech (Download)
curl -X POST http://localhost:5000/tts 
    -H " Content-Type: application/json " 
    -d ' {"text":"Hello, World!", "voice":"en-US-GuyNeural"} ' 
    --output output.mp3

# Text-to-Speech (Streaming)
curl -X POST http://localhost:5000/tts/stream 
    -H " Content-Type: application/json " 
    -d ' {"text":"Hello, World!", "voice":"en-US-GuyNeural"} ' 
    --output stream_output.mp3

Projet de frontend

React Frontend Companion Project

Vous cherchez une interface frontale prête à l'emploi?

? Lien rapide : React-Audio-Stream-Demo

Cette démonstration React fournit un frontage entièrement fonctionnel pour l'interaction TTS sans couture, ce qui facilite la démonstration et l'intégration du service Edge-TTS avec une interface conviviale.

FAQ

Q: Comment choisir la bonne voix?
R: Utilisez le point de terminaison /voices pour obtenir une liste de toutes les voix disponibles. Choisissez en fonction des attributs régionaux et de genre.
Q: Quelles langues sont prises en charge?
R: Plusieurs langues, y compris l'anglais, le chinois, le japonais, etc. Vérifiez le point de terminaison /voices pour une liste complète.
Q: Quel est le format de fichier audio?
R: Le service génère des fichiers audio MP3.

Notes

Le déploiement de Docker est recommandé pour les environnements de production
Le service a une limite de longueur de texte; Envisagez de diviser de longs textes
Le port par défaut est de 5000, configurable via des variables d'environnement