openai edge tts Download - openai edge tts Source Code Download

openai edge tts

شفرة المصدر الأخرى

1.0.0

تنزيل

Openai المتوافقة مع واجهة برمجة تطبيقات Edge-TTS

يوفر هذا المشروع واجهة برمجة تطبيقات محلية ومتوافقة مع النصي إلى كلام (TTS) باستخدام edge-tts . إنه يحاكي نقطة نهاية Openai TTS ( /v1/audio/speech ) ، مما يمكّن المستخدمين من إنشاء الكلام من نص مع خيارات صوتية مختلفة وسرعات تشغيل ، تمامًا مثل API Openai.

تستخدم edge-tts خدمة النص إلى الكلام عبر الإنترنت من Microsoft Edge ، لذلك فهي مجانية تمامًا.

عرض هذا المشروع على Docker Hub

من فضلك ️ نجم هذا الريبو إذا وجدت أنه مفيد

سمات

نقطة النهاية المتوافقة مع OpenAI : /v1/audio/speech مع بنية طلب مماثلة وسلوك.
الأصوات المدعومة : Maps Openai Voices (السبائك ، الصدى ، Fable ، Onyx ، Nova ، Shimmer) إلى edge-tts .
التنسيقات المرنة : يدعم تنسيقات صوتية متعددة (MP3 ، Opus ، AAC ، FLAC ، WAV ، PCM).
السرعة القابلة للتعديل : خيار لتعديل سرعة التشغيل (0.25x إلى 4.0x).
اختيار الصوت المباشر-TTS الاختياري : استخدم إما تعيينات صوت Openai أو تحديد أي صوت TTS مباشرة.

ابدء

المتطلبات الأساسية

Docker (موصى به): Docker و Docker Compose لإعداد الحاويات.
Python (اختياري): للتطوير المحلي ، تثبيت التبعيات في requirements.txt . txt.
FFMPEG (اختياري): مطلوب لتحويل تنسيق الصوت. اختياري إذا التمسك mp3.

تثبيت

استنساخ المستودع :

git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

متغيرات البيئة : قم بإنشاء ملف .env في دليل الجذر مع المتغيرات التالية:

 API_KEY=your_api_key_here
PORT=5050

DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2

DEFAULT_LANGUAGE=en-US

REQUIRE_API_KEY=True

أو ، انسخ الافتراضي .env.example مع ما يلي:

cp .env.example .env

تشغيل مع Docker Compose (موصى به):

docker compose up --build

(ملاحظة: Docker-Compose ليس هو نفسه Docker Compose)

قم بتشغيل -d لتشغيل Docker Compens في "الوضع المنفصل" ، مما يعني أنه سيتم تشغيله في الخلفية وتحرير المحطة الخاصة بك.

docker compose up -d

بدلاً من ذلك ، قم بالتشغيل مباشرة مع Docker :

docker build -t openai-edge-tts .
docker run -p 5050:5050 --env-file .env openai-edge-tts

لتشغيل الحاوية في الخلفية ، أضف -d بعد أمر docker run :

docker run -d -p 5050:5050 --env-file .env openai-edge-tts

الوصول إلى واجهة برمجة التطبيقات : يمكن الوصول إلى الخادم الخاص بك على http://localhost:5050 .

الجري مع بيثون

إذا كنت تفضل تشغيل هذا المشروع مباشرة مع Python ، فاتبع الخطوات هذه لإعداد بيئة افتراضية وتثبيت التبعيات وبدء الخادم.

1. استنساخ المستودع

git clone https://github.com/travisvn/openai-edge-tts.git
cd openai-edge-tts

2. إعداد بيئة افتراضية

إنشاء وتفعيل بيئة افتراضية لعزل التبعيات:

 # For macOS/Linux
python3 -m venv venv
source venv/bin/activate

# For Windows
python -m venv venv
venv S cripts a ctivate

3. تثبيت التبعيات

استخدم pip لتثبيت الحزم المطلوبة المدرجة في requirements.txt :

pip install -r requirements.txt

4. تكوين متغيرات البيئة

قم بإنشاء ملف .env في الدليل الجذر وقم بتعيين المتغيرات التالية:

 API_KEY=your_api_key_here
PORT=5050

DEFAULT_VOICE=en-US-AndrewNeural
DEFAULT_RESPONSE_FORMAT=mp3
DEFAULT_SPEED=1.2

DEFAULT_LANGUAGE=en-US

REQUIRE_API_KEY=True

5. قم بتشغيل الخادم

بمجرد تكوينه ، ابدأ الخادم بـ:

python app/server.py

سيبدأ الخادم في التشغيل على http://localhost:5050 .

6. اختبار واجهة برمجة التطبيقات

يمكنك الآن التفاعل مع API على http://localhost:5050/v1/audio/speech ونقاط النهاية الأخرى المتاحة. انظر قسم الاستخدام للحصول على أمثلة الطلب.

الاستخدام

نقطة النهاية: `/v1/audio/speech`

يولد الصوت من نص الإدخال. المعلمات المتاحة:

المعلمة المطلوبة:

إدخال (سلسلة): النص المراد تحويله إلى صوت (حتى 4096 حرفًا).

المعلمات الاختيارية:

النموذج (السلسلة): تعيين على "TTS-1" أو "TTS-1-HD" (افتراضي: "tts-1" ).
Voice (سلسلة): أحد الأصوات المتوافقة مع Openai (السبائك ، الصدى ، Fable ، Onyx ، Nova ، Shimmer) أو أي صوت edge-tts صالحة (افتراضي: "en-US-AndrewNeural" ).
استجابة _format (سلسلة): تنسيق الصوت. الخيارات: mp3 ، opus ، aac ، flac ، wav ، pcm (افتراضي: mp3 ).
السرعة (العدد): سرعة التشغيل (0.25 إلى 4.0). الافتراضي هو 1.2 .

مثال طلب مع curl وحفظ الإخراج إلى ملف mp3:

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "input": "Hello, I am your AI assistant! Just let me know how I can help bring your ideas to life.",
    "voice": "echo",
    "response_format": "mp3",
    "speed": 1.2
  } ' 
  --output speech.mp3

أو ، أن تكون متوافقة مع معلمات نقطة نهاية Openai API:

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "model": "tts-1",
    "input": "Hello, I am your AI assistant! Just let me know how I can help bring your ideas to life.",
    "voice": "alloy"
  } ' 
  --output speech.mp3

ومثال على لغة أخرى غير الإنجليزية:

curl -X POST http://localhost:5050/v1/audio/speech 
  -H " Content-Type: application/json " 
  -H " Authorization: Bearer your_api_key_here " 
  -d ' {
    "model": "tts-1",
    "input": "じゃあ、行く。電車の時間、調べておくよ。",
    "voice": "ja-JP-KeitaNeural"
  } ' 
  --output speech.mp3

نقاط نهاية إضافية

post/get/v1/models : قوائم نماذج TTS المتاحة.
Post /Get /V1 /Voices : يسرد أصوات edge-tts للغة /لغة معينة.
post/get/v1/voices/all : يسرد جميع أصوات edge-tts ، مع معلومات دعم اللغة.

المساهمة

المساهمات مرحب بها! يرجى تورك المستودع وإنشاء طلب سحب لأي تحسينات.

رخصة

تم ترخيص هذا المشروع بموجب رخصة GNU العامة العمومية V3.0 (GPL-3.0) ، ويهدف حالة الاستخدام المقبولة إلى الاستخدام الشخصي. للاستخدام المؤسسي أو غير شخصي لـ openai-edge-tts ، اتصل بي على [email protected]

مثال استخدام الحالة

نصيحة

تبديل localhost إلى IP المحلي الخاص بك (على سبيل المثال ، 192.168.0.1 ) إذا كان لديك مشاكل

قد يكون الأمر كذلك ، عند الوصول إلى نقطة النهاية هذه على خادم / كمبيوتر مختلف أو عندما يتم إجراء المكالمة من مصدر آخر (مثل Open Webui) ، تحتاج إلى تغيير عنوان URL من localhost إلى IP المحلي (شيء مثل 192.168.0.1 أو ما شابه)

افتح webui

افتح لوحة المسؤول وانتقل إلى الإعدادات -> الصوت

أدناه ، يمكنك رؤية لقطة شاشة للتكوين الصحيح لاستخدام هذا المشروع لاستبدال نقطة نهاية Openai

ملحوظة

عرض المستندات الرسمية لتكامل webui المفتوح مع Openai Edge TTS

أي شيء

في الإصدار 1.6.8 ، أضاف أي شيء دعمًا لـ "مقدمي خدمات Openai TTS العام" - وهذا يعني أنه يمكننا استخدام هذا المشروع كمزود TTS في أي شيء

افتح الإعدادات وانتقل إلى Voice & Speech (تحت مقدمي الخدمات الذكاء)

أدناه ، يمكنك رؤية لقطة شاشة للتكوين الصحيح لاستخدام هذا المشروع لاستبدال نقطة نهاية Openai

معلومات سريعة

لا تحتاج إلى استبدال your_api_key_here - لا يلزم وجود مفتاح API "حقيقي". استخدم أي سلسلة تريد.
أسرع طريقة للحصول على هذا الأمر وتشغيله هي تثبيت Docker وتشغيل الأمر أدناه:

docker run -d -p 5050:5050 -e API_KEY=your_api_key_here -e PORT=5050 travisvn/openai-edge-tts:latest

عينات الصوت؟ ️

تشغيل عينات الصوت وشاهد جميع أصوات TTS المتاحة

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-02-28
الحجم 22.63KB
من Github

تطبيقات ذات صلة

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

شفرة المصدر الأخرى

1.0.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

شفرة المصدر الأخرى

1.0.0

أخبار ذات صلة الكل

openai edge tts

Openai المتوافقة مع واجهة برمجة تطبيقات Edge-TTS

من فضلك ️ نجم هذا الريبو إذا وجدت أنه مفيد

سمات

ابدء

المتطلبات الأساسية

تثبيت

الجري مع بيثون

1. استنساخ المستودع

2. إعداد بيئة افتراضية

3. تثبيت التبعيات

4. تكوين متغيرات البيئة

5. قم بتشغيل الخادم

6. اختبار واجهة برمجة التطبيقات

الاستخدام

نقطة النهاية: `/v1/audio/speech`

نقاط نهاية إضافية

المساهمة

رخصة

مثال استخدام الحالة

افتح webui

أي شيء

معلومات سريعة

عينات الصوت؟ ️

openai realtime console

F5 TTS ComfyUI

openai

OpenAI النسخة المحلية

الكسوف: حافة الضوء

حافة المجرة

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf

openai edge tts

Openai المتوافقة مع واجهة برمجة تطبيقات Edge-TTS

من فضلك ️ نجم هذا الريبو إذا وجدت أنه مفيد

سمات

ابدء

المتطلبات الأساسية

تثبيت

الجري مع بيثون

1. استنساخ المستودع

2. إعداد بيئة افتراضية

3. تثبيت التبعيات

4. تكوين متغيرات البيئة

5. قم بتشغيل الخادم

6. اختبار واجهة برمجة التطبيقات

الاستخدام

نقطة النهاية: /v1/audio/speech

نقاط نهاية إضافية

المساهمة

رخصة

مثال استخدام الحالة

افتح webui

أي شيء

معلومات سريعة

عينات الصوت؟ ️

نقطة النهاية: `/v1/audio/speech`