edge tts as a service download - edge tts as a service Download

edge tts as a service

Código-Fonte de IA

1.0.0

Baixar

Serviço HTTP Edge-TTS

Um serviço HTTP simples que fornece funcionalidade de texto em fala usando o mecanismo TTS da Microsoft Edge, suportando vários idiomas e vozes através de APIs RESTful.

Inglês | 中文

Características

? Múltiplos idiomas e vozes suportam
Saída de áudio de streaming e não transmitida
? Interface API de REST simples
? Suporte do Docker
⚡ Resposta de baixa latência

Início rápido

Opção 1: Execute diretamente

Clone o repositório:

git clone https://github.com/doctoroyy/edge-tts-as-a-service
cd edge-tts-as-a-service

Instale dependências:

pip install -r requirements.txt

Inicie o serviço:

python main.py

O serviço estará disponível em http://localhost:5000

Opção 2: Implantação do Docker

Construa a imagem:

docker build -t edge-tts-as-a-service .

Execute o contêiner:

docker run -d -p 5000:5000 edge-tts-as-a-service

Documentação da API

1. Lista de vozes disponíveis

Recuperar todas as opções de voz suportadas.

 GET /voices

Exemplo de resposta:

{
    "code" : 200 ,
    "message" : " OK " ,
    "data" : [
        {
            "Name" : " en-US-GuyNeural " ,
            "ShortName" : " en-US-GuyNeural " ,
            "Gender" : " Male " ,
            "Locale" : " en-US "
        },
        // ... more voices
    ]
}

2. Texto-fala (download)

Converta o texto em fala e faça o download do arquivo de áudio.

 POST /tts

Solicitar corpo:

{
    "text" : " Hello, World! " ,
    "voice" : " en-US-GuyNeural " ,    // Optional, defaults to "zh-CN-YunxiNeural"
    "file_name" : " hello.mp3 "       // Optional, defaults to "test.mp3"
}

Resposta:

Tipo de conteúdo: áudio/mpeg
Retorna o fluxo de arquivos de áudio

3. Texto-fala (streaming)

Converta o texto em fala com a saída de streaming, adequada para reprodução em tempo real.

 POST /tts/stream

Solicitar corpo:

{
    "text" : " Hello, World! " ,
    "voice" : " en-US-GuyNeural "    // Optional, defaults to "zh-CN-YunxiNeural"
}

Resposta:

Tipo de conteúdo: aplicativo/stream de octeto
Retorna o fluxo de áudio

Exemplos de uso

Exemplo de Python

 import requests

# Get available voices
response = requests . get ( 'http://localhost:5000/voices' )
voices = response . json ()[ 'data' ]

# Text-to-Speech (Download)
data = {
    "text" : "Hello, World!" ,
    "voice" : "en-US-GuyNeural" ,
    "file_name" : "output.mp3"
}
response = requests . post ( 'http://localhost:5000/tts' , json = data )
with open ( 'output.mp3' , 'wb' ) as f :
    f . write ( response . content )

# Text-to-Speech (Streaming)
response = requests . post ( 'http://localhost:5000/tts/stream' , json = data , stream = True )
with open ( 'stream_output.mp3' , 'wb' ) as f :
    for chunk in response . iter_content ( chunk_size = 8192 ):
        f . write ( chunk )

Exemplo de Curl

 # Get available voices
curl http://localhost:5000/voices

# Text-to-Speech (Download)
curl -X POST http://localhost:5000/tts 
    -H " Content-Type: application/json " 
    -d ' {"text":"Hello, World!", "voice":"en-US-GuyNeural"} ' 
    --output output.mp3

# Text-to-Speech (Streaming)
curl -X POST http://localhost:5000/tts/stream 
    -H " Content-Type: application/json " 
    -d ' {"text":"Hello, World!", "voice":"en-US-GuyNeural"} ' 
    --output stream_output.mp3

Projeto de front -end

React Project Companion

Procurando uma interface de front-end pronta para uso?

? Link rápido : React-Audio-Stream-Demo

Essa demonstração do React fornece um front-end totalmente funcional para a interação TTS perfeita, facilitando a demonstração e integração do serviço Edge-TTS com uma interface amigável.

Perguntas frequentes

P: Como escolho a voz certa?
R: Use o ponto final /voices para obter uma lista de todas as vozes disponíveis. Escolha com base nos atributos de localidade e gênero.
P: Quais idiomas são suportados?
R: Vários idiomas, incluindo inglês, chinês, japonês, etc. Verifique o terminal /voices para uma lista completa.
P: Qual é o formato de arquivo de áudio?
A: O serviço gera arquivos de áudio MP3.

Notas

A implantação do Docker é recomendada para ambientes de produção
O serviço tem um limite de comprimento de texto; Considere dividir textos longos
A porta padrão é 5000, configurável através de variáveis de ambiente