openai edge ttsダウンロード - openai edge ttsソースコードダウンロード

openai edge tts

その他のソースコード

1.0.0

ダウンロード

OpenAI互換EDGE-TTS API

このプロジェクトは、 edge-ttsを使用して、ローカルのOpenai互換のテキスト対スピーチ（TTS）APIを提供します。 OpenAI TTSエンドポイント（ /v1/audio/speech ）をエミュレートし、OpenAI APIのように、さまざまな音声オプションと再生速度でテキストからスピーチを生成できるようになります。

edge-tts Microsoft Edgeのオンラインテキストからスピーチサービスを使用するため、完全に無料です。

Docker Hubでこのプロジェクトをご覧ください

あなたがそれが役立つと思うなら、このレポを主演させてください

特徴

OpenAI互換のエンドポイント： /v1/audio/speechが同様の要求構造と動作を備えています。
サポートされている声：Maps Openai Voices（合金、エコー、Fable、Onyx、Nova、Shimmer）に同等のedge-tts 。
柔軟な形式：複数のオーディオ形式（MP3、OPUS、AAC、FLAC、WAV、PCM）をサポートします。
調整可能な速度：再生速度を変更するオプション（0.25x〜4.0x）。
オプションのダイレクトエッジ-TTS音声選択：OpenAI音声マッピングのいずれかを使用するか、Edge-TTS音声を直接指定します。

はじめる

前提条件

Docker （推奨）：DockerとDockerがコンテナ化されたセットアップ用に構成します。
Python （オプション）：ローカル開発については、 requirements.txtに依存関係をインストールします。
FFMPEG （オプション）：オーディオ形式の変換に必要です。 MP3に固執する場合はオプション。

インストール

リポジトリをクローンします：

git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

環境変数：次の変数を使用して、ルートディレクトリに.envファイルを作成します。

 API_KEY=your_api_key_here
PORT=5050

DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2

DEFAULT_LANGUAGE=en-US

REQUIRE_API_KEY=True

または、デフォルト.env.example次のものにコピーします。

cp .env.example .env

Docker Compose（推奨）で実行：

docker compose up --build

（注：Docker-ComposeはDocker Composeと同じではありません）

-dで実行して、「デタッチモード」でDocker Composeを実行します。つまり、バックグラウンドで実行され、端末を解放します。

docker compose up -d

または、 Dockerで直接実行します。

docker build -t openai-edge-tts .
docker run -p 5050:5050 --env-file .env openai-edge-tts

バックグラウンドでコンテナを実行するには、 docker runコマンドの後に-dを追加します。

docker run -d -p 5050:5050 --env-file .env openai-edge-tts

APIへのアクセス：サーバーはhttp://localhost:5050でアクセスできます。

Pythonで走っています

このプロジェクトをPythonで直接実行したい場合は、次の手順に従って仮想環境を設定し、依存関係をインストールし、サーバーを開始します。

1。リポジトリをクローンします

git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

2。仮想環境を設定します

仮想環境を作成およびアクティブにして、依存関係を分離します。

 # For macOS/Linux
python3 -m venv venv
source venv/bin/activate

# For Windows
python -m venv venv
venv S cripts a ctivate

3.依存関係をインストールします

pipを使用して、 requirements.txtにリストされている必要なパッケージをインストールします。txt：

pip install -r requirements.txt

4.環境変数を構成します

ルートディレクトリに.envファイルを作成し、次の変数を設定します。

 API_KEY=your_api_key_here
PORT=5050

DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2

DEFAULT_LANGUAGE=en-US

REQUIRE_API_KEY=True

5.サーバーを実行します

構成したら、以下でサーバーを起動します

python app/server.py

サーバーはhttp://localhost:5050で実行を開始します。

6. APIをテストします

これで、 http://localhost:5050/v1/audio/speechおよびその他の使用可能なエンドポイントでAPIと対話できるようになりました。リクエストの例については、使用法のセクションを参照してください。

使用法

endpoint： `/v1/audio/speech`

入力テキストからオーディオを生成します。利用可能なパラメーター：

必須パラメーター：

入力（文字列）：オーディオに変換されるテキスト（最大4096文字）。

オプションのパラメーター：

モデル（文字列）：「TTS-1」または「TTS-1-HD」に設定（デフォルト： "tts-1" ）。
Voice （String）：Openai互換の声の1つ（合金、Echo、Fable、Onyx、Nova、Shimmer）または有効なedge-tts Voice（デフォルト： "en-US-AndrewNeural" ）。
Response_Format （文字列）：オーディオ形式。オプション： mp3 、 opus 、 aac 、 flac 、 wav 、 pcm （デフォルト： mp3 ）。
速度（数）：再生速度（0.25〜4.0）。デフォルトは1.2です。

curlでリクエストを例とし、出力をMP3ファイルに保存します。

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "input": "Hello, I am your AI assistant! Just let me know how I can help bring your ideas to life.",
    "voice": "echo",
    "response_format": "mp3",
    "speed": 1.2
  } ' 
  --output speech.mp3

または、OpenAI APIエンドポイントパラメーターに沿っていること：

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "model": "tts-1",
    "input": "Hello, I am your AI assistant! Just let me know how I can help bring your ideas to life.",
    "voice": "alloy"
  } ' 
  --output speech.mp3

英語以外の言語の例：

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "model": "tts-1",
    "input": "じゃあ、行く。電車の時間、調べておくよ。",
    "voice": "ja-JP-KeitaNeural"
  } ' 
  --output speech.mp3

追加のエンドポイント

POST/GET/V1/モデル：利用可能なTTSモデルをリストします。
POST /GET /V1 /VOICES ：特定の言語 /ロケールのedge-tts Voicesをリストします。
POST/GET/V1/VOICES/ALL ：言語サポート情報を使用して、すべてのedge-ttsボイスをリストします。

貢献

貢献は大歓迎です！リポジトリをフォークし、改善のためのプルリクエストを作成してください。

ライセンス

このプロジェクトは、GNU General Public License v3.0（GPL-3.0）の下でライセンスされており、許容可能なユースケースは個人的な使用を目的としています。 openai-edge-ttsの企業または非個人的な使用については、[email protected]までご連絡ください

ユースケースの例

ヒント

localhostローカルIP（例192.168.0.1 ）に交換してください

別のサーバー /コンピューターでこのエンドポイントにアクセスする場合、または別のソース（Open WebUIなど）から呼び出しが行われたときに、 localhostからローカルIP（ 192.168.0.1など）にURLを変更する必要がある場合があります。

WebUIを開きます

管理パネルを開いて設定に移動します - >オーディオ

以下に、このプロジェクトを使用してOpenAIエンドポイントを代用するための正しい構成のスクリーンショットを見ることができます

注記

Openai EdgeTTSとのオープンWebUIの統合については、公式ドキュメントを見る

何でも

バージョン1.6.8では、「ジェネリックOpenai TTSプロバイダー」のサポートを追加しました。つまり、このプロジェクトをAnythllmのTTSプロバイダーとして使用できることを意味します。

設定を開いて、音声＆スピーチに移動します（AIプロバイダーの下）

以下に、このプロジェクトを使用してOpenAIエンドポイントを代用するための正しい構成のスクリーンショットを見ることができます

簡単な情報

your_api_key_here交換する必要はありません - 「リアル」APIキーは必要ありません。必要な文字列を使用してください。
これを起動して実行する最も簡単な方法は、Dockerをインストールしてコマンドを以下に実行することです。

docker run -d -p 5050:5050 -e API_KEY=your_api_key_here -e PORT=5050 travisvn/openai-edge-tts:latest

音声サンプル？§

音声サンプルを再生して、利用可能なすべてのエッジTTSの声を見る

拡大する

追加情報

バージョン 1.0.0
タイプその他のソースコード
更新時間 2025-02-28
サイズ 22.63KB
から Github

openai edge tts

OpenAI互換EDGE-TTS API

あなたがそれが役立つと思うなら、このレポを主演させてください

特徴

はじめる

前提条件

インストール

Pythonで走っています

1。リポジトリをクローンします

2。仮想環境を設定します

3.依存関係をインストールします

4.環境変数を構成します

5.サーバーを実行します

6. APIをテストします

使用法

endpoint： `/v1/audio/speech`

追加のエンドポイント

貢献

ライセンス

ユースケースの例

WebUIを開きます

何でも

簡単な情報

音声サンプル？§

openai realtime console

F5 TTS ComfyUI

オープンナイ

OpenAI国内版

エクリプス: エッジ・オブ・ライト

ギャラクシーの端

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf

openai edge tts

OpenAI互換EDGE-TTS API

あなたがそれが役立つと思うなら、このレポを主演させてください

特徴

はじめる

前提条件

インストール

Pythonで走っています

1。リポジトリをクローンします

2。仮想環境を設定します

3.依存関係をインストールします

4.環境変数を構成します

5.サーバーを実行します

6. APIをテストします

使用法

endpoint： /v1/audio/speech

追加のエンドポイント

貢献

ライセンス

ユースケースの例

WebUIを開きます

何でも

簡単な情報

音声サンプル？§

endpoint： `/v1/audio/speech`