openai edge tts Скачать - openai edge tts Скачать исходный код

openai edge tts

Другой исходный код

1.0.0

Скачать

OpenAI-совместимый Edge-TTS API

Этот проект предоставляет локальный API, совместимый с OpenAI, с использованием Edge-TTS, с использованием edge-tts . Он эмулирует конечную точку Openai TTS ( /v1/audio/speech ), позволяя пользователям генерировать речь из текста с различными параметрами голоса и скоростью воспроизведения, как API OpenAI.

edge-tts использует онлайн-сервис Microsoft Edge текста в речь, поэтому он совершенно бесплатный.

Посмотреть этот проект на Docker Hub

Пожалуйста ️ Светь это репо, если вы найдете его полезным

Функции

OpenAI-совместимая конечная точка : /v1/audio/speech с аналогичной структурой запроса и поведением.
Поддерживаемые голоса : карты Openai Voices (сплав, Echo, Fable, Onyx, Nova, Shimmer) в эквивалентах edge-tts .
Гибкие форматы : поддерживает несколько аудио форматов (MP3, Opus, AAC, FLAC, WAV, PCM).
Регулируемая скорость : опция для изменения скорости воспроизведения (0,25x до 4,0x).
Необязательный выбор голоса прямого Edge-TTS : используйте либо Voice Voice Mappings, либо укажите какой-либо голос Edge-TTS напрямую.

Начиная

Предварительные условия

Docker (рекомендуется): Docker и Docker Compose для контейнерной установки.
Python (необязательно): для локальной разработки установите зависимости в requirements.txt .
FFMPEG (необязательно): необходимо для преобразования аудио формата. Необязательно, если придерживаться mp3.

Установка

Клонировать репозиторий :

git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

Переменные среды : создайте файл .env в корневом каталоге со следующими переменными:

 API_KEY=your_api_key_here
PORT=5050

DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2

DEFAULT_LANGUAGE=en-US

REQUIRE_API_KEY=True

Или скопируйте по умолчанию .env.example со следующим:

cp .env.example .env

Запустите с Docker Compose (рекомендуется):

docker compose up --build

(Примечание: Docker-Compose-это не то же самое, что Docker Compose)

Запустите с -d для запуска Docker Compose в «Отдельный режим», что означает, что он будет работать в фоновом режиме и освободить ваш терминал.

docker compose up -d

В качестве альтернативы бегите напрямую с Docker :

docker build -t openai-edge-tts .
docker run -p 5050:5050 --env-file .env openai-edge-tts

Чтобы запустить контейнер в фоновом режиме, добавьте -d после команды docker run :

docker run -d -p 5050:5050 --env-file .env openai-edge-tts

Доступ к API : ваш сервер будет доступен по адресу http://localhost:5050 .

Бег с питоном

Если вы предпочитаете запустить этот проект напрямую с Python, выполните эти шаги, чтобы настроить виртуальную среду, установить зависимости и запустить сервер.

1. Клонировать репозиторий

git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

2. Настройте виртуальную среду

Создайте и активируйте виртуальную среду для изоляции зависимостей:

 # For macOS/Linux
python3 -m venv venv
source venv/bin/activate

# For Windows
python -m venv venv
venv S cripts a ctivate

3. Установите зависимости

Используйте pip , чтобы установить необходимые пакеты, перечисленные в requirements.txt :

pip install -r requirements.txt

4. Настройка переменных среды

Создайте файл .env в корневом каталоге и установите следующие переменные:

 API_KEY=your_api_key_here
PORT=5050

DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2

DEFAULT_LANGUAGE=en-US

REQUIRE_API_KEY=True

5. Запустите сервер

После настройки запустите сервер с:

python app/server.py

Сервер начнет работать по адресу http://localhost:5050 .

6. Проверьте API

Теперь вы можете взаимодействовать с API по адресу http://localhost:5050/v1/audio/speech и другие доступные конечные точки. См. Раздел использования примеров запроса.

Использование

Конечная точка: `/v1/audio/speech`

Генерирует звук из входного текста. Доступные параметры:

Требуемый параметр:

Input (String): текст, который будет преобразован в аудио (до 4096 символов).

Дополнительные параметры:

Model (String): установите на «TTS-1» или «TTS-1-HD» (по умолчанию: "tts-1" ).
Голос (строка): один из открытых совместимых голосов (сплав, эхо, басня, Onyx, Nova, Shimmer) или любой действительный голос edge-tts (по умолчанию: "en-US-AndrewNeural" ).
response_format (string): аудиоформат. Параметры: mp3 , opus , aac , flac , wav , pcm (по умолчанию: mp3 ).
Скорость (число): скорость воспроизведения (от 0,25 до 4,0). По умолчанию 1.2 .

Пример запроса с curl и сохранение вывода в файл mp3:

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "input": "Hello, I am your AI assistant! Just let me know how I can help bring your ideas to life.",
    "voice": "echo",
    "response_format": "mp3",
    "speed": 1.2
  } ' 
  --output speech.mp3

Или, чтобы соответствовать параметрам конечной точки API OpenAI:

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "model": "tts-1",
    "input": "Hello, I am your AI assistant! Just let me know how I can help bring your ideas to life.",
    "voice": "alloy"
  } ' 
  --output speech.mp3

И пример языка, отличного от английского:

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "model": "tts-1",
    "input": "じゃあ、行く。電車の時間、調べておくよ。",
    "voice": "ja-JP-KeitaNeural"
  } ' 
  --output speech.mp3

Дополнительные конечные точки

Post/get/v1/models : списки доступны модели TTS.
Post /get /v1 /voices : списки голосов edge-tts для данного языка /локализации.
Post/get/v1/voices/all : перечисляет все голоса edge-tts , с информацией о поддержке языка.

Внося

Взносы приветствуются! Пожалуйста, распадайте репозиторий и создайте запрос на притяжение для любых улучшений.

Лицензия

Этот проект лицензирован в рамках GNU General Public Public License v3.0 (GPL-3.0), и приемлемый вариант использования предназначен для личного использования. Для предприятия или не личностного использования openai-edge-tts , свяжитесь со мной по адресу [email protected]

Пример использования

Кончик

Поменяйте localhost на ваш местный IP (например, 192.168.0.1 ), если у вас есть проблемы

Это может быть так, что при доступе к этой конечной точке на другом сервере / компьютере или когда вызов сделан из другого источника (например, Open WebUI), вам необходимо изменить URL с localhost на свой локальный IP (что -то вроде 192.168.0.1 или аналогично)

Откройте Webui

Откройте панель администратора и перейдите к настройкам -> Аудио

Ниже вы можете увидеть скриншот правильной конфигурации для использования этого проекта, чтобы заменить конечную точку Openai

Примечание

Посмотреть официальные документы для открытой интеграции WebUI с Openai Edge TTS

Что угодно

В версии 1.6.8, что угодно, добавлена поддержка «общих поставщиков Openai TTS» - это означает, что мы можем использовать этот проект в качестве поставщика TTS во всем

Откройте настройки и перейдите к голосу и речи (при поставщиках искусственного интеллекта)

Ниже вы можете увидеть скриншот правильной конфигурации для использования этого проекта, чтобы заменить конечную точку Openai

Быстрая информация

your_api_key_here никогда не нужно заменяться - «реального» клавиши API не требуется. Используйте любую строку, которую вы хотели бы.
Самый быстрый способ запустить это - установить Docker и запустить команду ниже:

docker run -d -p 5050:5050 -e API_KEY=your_api_key_here -e PORT=5050 travisvn/openai-edge-tts:latest

Образцы голоса? ️

Играть в голосовые образцы и увидеть все доступные голоса Edge TTS

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-02-28
размер 22.63KB
От Github

Связанные приложения

openai edge tts

OpenAI-совместимый Edge-TTS API

Пожалуйста ️ Светь это репо, если вы найдете его полезным

Функции

Начиная

Предварительные условия

Установка

Бег с питоном

1. Клонировать репозиторий

2. Настройте виртуальную среду

3. Установите зависимости

4. Настройка переменных среды

5. Запустите сервер

6. Проверьте API

Использование

Конечная точка: `/v1/audio/speech`

Дополнительные конечные точки

Внося

Лицензия

Пример использования

Откройте Webui

Что угодно

Быстрая информация

Образцы голоса? ️

openai realtime console

F5 TTS ComfyUI

опенай

Внутренняя версия OpenAI

Затмение: Край Света

Край Галактики

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf

openai edge tts

OpenAI-совместимый Edge-TTS API

Пожалуйста ️ Светь это репо, если вы найдете его полезным

Функции

Начиная

Предварительные условия

Установка

Бег с питоном

1. Клонировать репозиторий

2. Настройте виртуальную среду

3. Установите зависимости

4. Настройка переменных среды

5. Запустите сервер

6. Проверьте API

Использование

Конечная точка: /v1/audio/speech

Дополнительные конечные точки

Внося

Лицензия

Пример использования

Откройте Webui

Что угодно

Быстрая информация

Образцы голоса? ️

Конечная точка: `/v1/audio/speech`