edge tts as a service

edge tts as a service

AI Исходный код

1.0.0

Скачать

Edge-TTS HTTP Service

Простая HTTP-сервис, которая предоставляет функциональность текста в речь с использованием TTS Microsoft Edge Engine, поддерживая несколько языков и голосов с помощью RESTFUL API.

Английский | 中文

Функции

? Поддержка нескольких языков и голосов
Как потоковая, так и не потоковая аудио вывод
? Простой интерфейс API REST
? Поддержка Docker
⚡ Ответ с низкой задержкой

Быстрый старт

Вариант 1: запустить напрямую

Клонировать репозиторий:

git clone https://github.com/doctoroyy/edge-tts-as-a-service
cd edge-tts-as-a-service

Установить зависимости:

pip install -r requirements.txt

Начните сервис:

python main.py

Служба будет доступна по адресу http://localhost:5000

Вариант 2: развертывание Docker

Создайте изображение:

docker build -t edge-tts-as-a-service .

Запустите контейнер:

docker run -d -p 5000:5000 edge-tts-as-a-service

Документация API

1. Перечислите доступные голоса

Получить все поддерживаемые варианты голоса.

 GET /voices

Пример ответа:

{
    "code" : 200 ,
    "message" : " OK " ,
    "data" : [
        {
            "Name" : " en-US-GuyNeural " ,
            "ShortName" : " en-US-GuyNeural " ,
            "Gender" : " Male " ,
            "Locale" : " en-US "
        },
        // ... more voices
    ]
}

2. Текст в речь (скачать)

Конвертируйте текст в речь и загрузите аудиофайл.

 POST /tts

Запросить тело:

{
    "text" : " Hello, World! " ,
    "voice" : " en-US-GuyNeural " ,    // Optional, defaults to "zh-CN-YunxiNeural"
    "file_name" : " hello.mp3 "       // Optional, defaults to "test.mp3"
}

Ответ:

Тип контента: аудио/MPEG
Возвращает аудиофайловый поток

3. Текст в речь (потоковая передача)

Преобразовать текст в речь с помощью потокового вывода, подходящего для воспроизведения в реальном времени.

 POST /tts/stream

Запросить тело:

{
    "text" : " Hello, World! " ,
    "voice" : " en-US-GuyNeural "    // Optional, defaults to "zh-CN-YunxiNeural"
}

Ответ:

Контент-тип: приложение/октябрь
Возвращает аудио -поток

Примеры использования

Пример Python

 import requests

# Get available voices
response = requests . get ( 'http://localhost:5000/voices' )
voices = response . json ()[ 'data' ]

# Text-to-Speech (Download)
data = {
    "text" : "Hello, World!" ,
    "voice" : "en-US-GuyNeural" ,
    "file_name" : "output.mp3"
}
response = requests . post ( 'http://localhost:5000/tts' , json = data )
with open ( 'output.mp3' , 'wb' ) as f :
    f . write ( response . content )

# Text-to-Speech (Streaming)
response = requests . post ( 'http://localhost:5000/tts/stream' , json = data , stream = True )
with open ( 'stream_output.mp3' , 'wb' ) as f :
    for chunk in response . iter_content ( chunk_size = 8192 ):
        f . write ( chunk )

пример скручивания

 # Get available voices
curl http://localhost:5000/voices

# Text-to-Speech (Download)
curl -X POST http://localhost:5000/tts 
    -H " Content-Type: application/json " 
    -d ' {"text":"Hello, World!", "voice":"en-US-GuyNeural"} ' 
    --output output.mp3

# Text-to-Speech (Streaming)
curl -X POST http://localhost:5000/tts/stream 
    -H " Content-Type: application/json " 
    -d ' {"text":"Hello, World!", "voice":"en-US-GuyNeural"} ' 
    --output stream_output.mp3

Фронтальный проект

Реагировать фронтальный компаньон проект

Ищете готовый к использованию интерфейс?

? Быстрая ссылка : React-Audio-Stream-Demo

Эта демонстрация React обеспечивает полностью функциональный фронт для бесшовного взаимодействия TTS, что позволяет легко демонстрировать и интегрировать службу Edge-TTS с удобным для пользователя интерфейс.

Часто задаваемые вопросы

В: Как выбрать правильный голос?
A: Используйте конечную точку /voices , чтобы получить список всех доступных голосов. Выберите на основе локальных и гендерных атрибутов.
В: Какие языки поддерживаются?
A: Несколько языков, включая английский, китайский, японский и т. Д. Проверьте конечную точку /voices для полного списка.
В: Что такое формат аудиофайла?
A: Служба генерирует аудиофайлы MP3.