Unduh openai edge tts - Unduh Kode Sumber openai edge tts

openai edge tts

Kode sumber lainnya

1.0.0

Unduh

API Edge-TTS Openai-Compatible

Proyek ini menyediakan API Text-to-Speech (TTS) lokal yang kompatibel dengan Openai menggunakan edge-tts . Ini meniru titik akhir OpenAI TTS ( /v1/audio/speech ), memungkinkan pengguna untuk menghasilkan pidato dari teks dengan berbagai opsi suara dan kecepatan pemutaran, seperti API OpenAI.

edge-tts menggunakan layanan teks-ke-speech online Microsoft Edge, sehingga sepenuhnya gratis.

Lihat proyek ini di Docker Hub

Harap ️ Bintang repo ini jika Anda menganggapnya sangat membantu

Fitur

Titik akhir yang kompatibel dengan openai : /v1/audio/speech dengan struktur permintaan dan perilaku yang serupa.
Suara yang Didukung : Peta Suara OpenAI (Paduan, Echo, Fable, Onyx, Nova, Shimmer) untuk setara dengan edge-tts .
Format Fleksibel : Mendukung beberapa format audio (MP3, Opus, AAC, FLAC, WAV, PCM).
Kecepatan yang dapat disesuaikan : Opsi untuk memodifikasi kecepatan pemutaran (0,25x ke 4.0x).
Pilihan Suara Opsional Edge Edge-TTS : Gunakan pemetaan suara OpenAI atau tentukan suara tepi-TTS secara langsung.

Memulai

Prasyarat

Docker (Disarankan): Docker dan Docker menyusun untuk pengaturan yang dikemas.
Python (opsional): Untuk pengembangan lokal, instal dependensi di requirements.txt .
FFMPEG (Opsional): Diperlukan untuk konversi format audio. Opsional jika menempel pada MP3.

Instalasi

Klon Repositori :

git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

Variabel Lingkungan : Buat file .env di direktori root dengan variabel berikut:

 API_KEY=your_api_key_here
PORT=5050

DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2

DEFAULT_LANGUAGE=en-US

REQUIRE_API_KEY=True

Atau, salin .env.example default dengan yang berikut:

cp .env.example .env

Jalankan dengan Docker Compose (disarankan):

docker compose up --build

(Catatan: Kompose Docker tidak sama dengan Docker Compose)

Jalankan dengan -d untuk menjalankan Docker Compose di "Detached Mode", artinya akan berjalan di latar belakang dan membebaskan terminal Anda.

docker compose up -d

Atau, jalankan langsung dengan Docker :

docker build -t openai-edge-tts .
docker run -p 5050:5050 --env-file .env openai-edge-tts

Untuk menjalankan wadah di latar belakang, tambahkan -d setelah perintah docker run :

docker run -d -p 5050:5050 --env-file .env openai-edge-tts

Akses API : Server Anda akan dapat diakses di http://localhost:5050 .

Berlari dengan Python

Jika Anda lebih suka menjalankan proyek ini secara langsung dengan Python, ikuti langkah -langkah ini untuk mengatur lingkungan virtual, menginstal dependensi, dan memulai server.

1. Kloning repositori

git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

2. Mengatur lingkungan virtual

Buat dan aktifkan lingkungan virtual untuk mengisolasi dependensi:

 # For macOS/Linux
python3 -m venv venv
source venv/bin/activate

# For Windows
python -m venv venv
venv S cripts a ctivate

3. Pasang dependensi

Gunakan pip untuk menginstal paket yang diperlukan yang tercantum dalam requirements.txt :

pip install -r requirements.txt

4. Mengkonfigurasi Variabel Lingkungan

Buat file .env di direktori root dan atur variabel berikut:

 API_KEY=your_api_key_here
PORT=5050

DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2

DEFAULT_LANGUAGE=en-US

REQUIRE_API_KEY=True

5. Jalankan server

Setelah dikonfigurasi, mulailah server dengan:

python app/server.py

Server akan mulai berjalan di http://localhost:5050 .

6. Uji API

Anda sekarang dapat berinteraksi dengan API di http://localhost:5050/v1/audio/speech dan titik akhir yang tersedia lainnya. Lihat bagian penggunaan untuk contoh permintaan.

Penggunaan

Titik akhir: `/v1/audio/speech`

Menghasilkan audio dari teks input. Parameter yang tersedia:

Parameter yang diperlukan:

Input (String): Teks yang akan dikonversi ke audio (hingga 4096 karakter).

Parameter opsional:

Model (String): Set ke "TTS-1" atau "TTS-1-HD" (default: "tts-1" ).
Voice (String): Salah satu suara yang kompatibel dengan Openai (paduan, gema, dongeng, onyx, nova, shimmer) atau suara edge-tts yang valid (default: "en-US-AndrewNeural" ).
response_format (string): format audio. Opsi: mp3 , opus , aac , flac , wav , pcm (Default: mp3 ).
Kecepatan (angka): Kecepatan pemutaran (0,25 hingga 4.0). Default adalah 1.2 .

Contoh Permintaan dengan curl dan Simpan Output ke File MP3:

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "input": "Hello, I am your AI assistant! Just let me know how I can help bring your ideas to life.",
    "voice": "echo",
    "response_format": "mp3",
    "speed": 1.2
  } ' 
  --output speech.mp3

Atau, sejalan dengan parameter titik akhir API OpenAI:

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "model": "tts-1",
    "input": "Hello, I am your AI assistant! Just let me know how I can help bring your ideas to life.",
    "voice": "alloy"
  } ' 
  --output speech.mp3

Dan contoh bahasa selain bahasa Inggris:

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "model": "tts-1",
    "input": "じゃあ、行く。電車の時間、調べておくよ。",
    "voice": "ja-JP-KeitaNeural"
  } ' 
  --output speech.mp3

Titik akhir tambahan

POST/GET/V1/MODEL : Daftar model TTS yang tersedia.
POST /GET /V1 /VOICES : Daftar suara edge-tts untuk bahasa /lokal yang diberikan.
POST/GET/V1/VOICES/ALL : Daftar semua suara edge-tts , dengan informasi dukungan bahasa.

Berkontribusi

Kontribusi dipersilakan! Harap bayar repositori dan buat permintaan tarik untuk perbaikan apa pun.

Lisensi

Proyek ini dilisensikan berdasarkan GNU Umum Lisensi Publik v3.0 (GPL-3.0), dan kasus penggunaan yang dapat diterima dimaksudkan untuk digunakan pribadi. Untuk perusahaan atau penggunaan non-pribadi openai-edge-tts , hubungi saya di [email protected]

Contoh Penggunaan Kasus

Tip

Tukar localhost ke IP lokal Anda (Kel. 192.168.0.1 ) Jika Anda memiliki masalah

Mungkin saja, ketika mengakses titik akhir ini pada server / komputer yang berbeda atau ketika panggilan dilakukan dari sumber lain (seperti WebUI terbuka), Anda perlu mengubah URL dari localhost ke IP lokal Anda (sesuatu seperti 192.168.0.1 atau serupa)

Buka WebUI

Buka Panel Admin dan Pergi ke Pengaturan -> Audio

Di bawah ini, Anda dapat melihat tangkapan layar dari konfigurasi yang benar untuk menggunakan proyek ini untuk mengganti titik akhir openai

Catatan

Lihat dokumen resmi untuk integrasi WebUI terbuka dengan Openai Edge TTS

Apapun

Dalam versi 1.6.8, apa pun yang ditambahkan dukungan untuk "penyedia tts openai generik" - yang berarti kita dapat menggunakan proyek ini sebagai penyedia TTS dalam apa pun

Buka Pengaturan dan Pergi ke Voice & Speech (di bawah Penyedia AI)