تنزيل jBark - تنزيل رمز المصدر jBark

jBark

كود الذكاء الاصطناعي

1.0.0

تنزيل

وثائق مكتبة JBARK

جدول المحتويات

نظرة عامة ومقدمة
دليل التثبيت
تعليمات الاستخدام
التكوين والتخصيص
مرجع API
الهندسة المعمارية والتصميم
الاختبار والتصحيح
القضايا الشائعة والأسئلة الشائعة

نظرة عامة ومقدمة

JBark هي مكتبة Python قوية تعتمد على إمكانيات مشروع Bark Text-to-Spection الأصلي [https://github.com/suno-ai/bark] ، مع إضافة ميزات تحويل صوتي بسيطة. يوفر واجهة سلسة لتوليد خطاب عالي الجودة من النص ، واستخراج الخصائص الصوتية الأساسية ، وتطبيق هذه الخصائص على الصوت الذي تم إنشاؤه.

تتضمن الميزات الرئيسية لـ JBark:

توليد نص إلى كلام باستخدام نموذج اللحاء
استخراج مميزات صوت بسيط
تحويل الصوت الأساسي باستخدام تحول الملعب وتعديل الإيقاع
دعم لغات متعددة
الحسابات القائمة على وحدة المعالجة المركزية (لا مطلوب وحدة معالجة الرسومات)
قمع التحذيرات المشتركة لتجربة مستخدم أنظف

سواء كنت تقوم بتطوير مساعد افتراضي ، أو إنشاء كتب صوتية ، أو العمل على أي مشروع يتطلب توليفة خطاب مرنة وعالية الجودة ، يوفر JBark الأدوات التي تحتاجها لإحياء أفكارك إلى الحياة.

دليل التثبيت

لتثبيت Jbark ، اتبع هذه الخطوات:

تأكد من تثبيت Python 3.7 أو لاحقًا على نظامك.
تثبيت Jbark وتبعياتها:
```
 pip install jbark numpy torch scipy librosa resampy
```
ملاحظة: يستخدم JBark وحدة المعالجة المركزية للحسابات افتراضيًا. إذا كنت ترغب في استخدام تسريع GPU ، فتأكد من تثبيت الإصدار المناسب من CUDA من Pytorch.

تعليمات الاستخدام

إليك مثال أساسي على كيفية استخدام JBark:

 from jbark import JBark

# Initialize jBark
jbark = JBark ()

# Generate audio from text
text = "Hello, this is a test of jBark text-to-speech."
output_path = "output.wav"
audio_array = jbark . generate_audio ( text , output_path )

# Extract voice characteristics
sample_audio = "sample_voice.wav"
voice_chars = jbark . simple_voice_clone ( sample_audio )

# Generate audio with simple voice conversion
converted_text = "This is speech using simple voice conversion."
converted_output_path = "converted_output.wav"
converted_audio = jbark . generate_with_cloned_voice ( converted_text , voice_chars , converted_output_path )

# List supported languages
languages = jbark . list_supported_languages ()
print ( "Supported languages:" , languages )

يوضح هذا المثال سير العمل الأساسي لتوليد الكلام ، واستخراج الخصائص الصوتية ، وتطبيق تحويل صوت بسيط على الصوت الذي تم إنشاؤه.

التكوين والتخصيص

يوفر Jbark عدة خيارات للتخصيص:

قمع التحذير : افتراضيًا ، يمنع JBark تحذيرات مشتركة. يتم التعامل مع هذا السلوك داخليًا ولا يتطلب تكوين المستخدم.
الإعدادات المسبقة الصوتية : عند إنشاء الصوت ، يمكنك تحديد إعداد مسبق صوتي:
```
 audio_array = jbark . generate_audio ( text , history_prompt = "v2/en_speaker_6" )
```
معلمات تحويل الصوت : يمكنك ضبط قوة تحول الملعب وتعديل الإيقاع عن طريق تعديل طريقة simple_voice_conversion في فئة JBark .

مرجع API

فئة jbark

`init(self)`

تهيئة مثيل JBARK ، ويعقد التحذيرات ، ونماذج التحميل المسبقة.

`generate_audio(self, text_prompt: str, output_path: str = None, history_prompt: str = None) -> numpy.ndarray`

يولد الصوت من موجه النص المحدد.

text_prompt : النص الذي يجب تحويله إلى خطاب.
output_path : اختياري. مسار لحفظ الصوت الذي تم إنشاؤه.
history_prompt : اختياري. مسبق الصوت للاستخدام.

إرجاع: صفيف numpy يحتوي على بيانات الصوت.

`simple_voice_clone(self, audio_path: str) -> dict`

يستخلص الخصائص الصوتية الأساسية من عينة صوتية.

audio_path : مسار إلى عينة الصوت لاستخراج مميزة الصوت.

إرجاع: القاموس الذي يحتوي على خصائص الصوت الأساسية (الملعب والإيقاع).

`generate_with_cloned_voice(self, text_prompt: str, voice_characteristics: dict, output_path: str) -> numpy.ndarray`

يولد الصوت باستخدام تحويل صوت بسيط استنادًا إلى خصائص الصوت المستخرجة.

text_prompt : النص الذي يجب تحويله إلى خطاب.
voice_characteristics : القاموس الذي يحتوي على خصائص الصوت (الملعب والإيقاع).
output_path : مسار لحفظ الصوت الذي تم إنشاؤه.

إرجاع: صفيف numpy يحتوي على بيانات الصوت.

`simple_voice_conversion(self, audio: numpy.ndarray, voice_characteristics: dict) -> numpy.ndarray`

يطبق التحويل الصوتي البسيط على صوت الإدخال بناءً على خصائص الصوت المحددة.

audio : إدخال صفيف الصوت.
voice_characteristics : القاموس الذي يحتوي على خصائص الصوت (الملعب والإيقاع).

إرجاع: صفيف الصوت المحول.

`custom_time_stretch(self, audio: numpy.ndarray, rate: float) -> numpy.ndarray`

وظيفة تمدد الوقت المخصص باستخدام إعادة أخذ عينات.

audio : إدخال صفيف الصوت.
rate : معدل امتداد الوقت.

عائدات: صفيف الصوت المقطّر بالوقت.

`list_supported_languages(self) -> dict`

إرجاع قاموس اللغات المدعومة.

الهندسة المعمارية والتصميم

تم تصميم JBark مع وضع وحدات وامتداد في الاعتبار. المكونات الرئيسية هي:

فئة Jbark : الواجهة المركزية لجميع الوظائف.
طراز اللحاء : يتولى توليد نص إلى كلام.
وحدة تحويل الصوت البسيطة : تدير استخراج وتطبيق صوتي أساسي.

تتبع المكتبة نمطًا للواجهة ، حيث توفر فئة JBARK واجهة مبسطة لأنظمة تحويل النص إلى الكلام والصوت الأساسي.

الاختبار والتصحيح

يأتي JBark مع جناحين اختبار:

مجموعة الاختبار الأساسية ( test_jbark.py ): لتشغيل مجموعة الاختبار الأساسية:
```
 python test_jbark.py
```
سيؤدي ذلك إلى إطلاق قائمة تفاعلية تتيح لك اختبار ميزات مختلفة من مكتبة JBARK.
مجموعة الاختبار الموسعة ( test2.py ): لتشغيل مجموعة الاختبار الموسعة:
```
 python test2.py
```
يوفر هذا الجناح اختبارًا أكثر شمولاً ، بما في ذلك الاختلافات في توليد الصوت ، واستنساخ الصوت ، وتحويل الصوت ، ودعم اللغة ، ومعالجة الأخطاء ، واختبار الأداء.

لتصحيح الأخطاء ، يمكنك استخدام وحدة pdb المدمجة في Python أو IDE مثل Pycharm أو VSCode.

القضايا الشائعة والأسئلة الشائعة

س: لماذا بطيء توليد الصوت؟ ج: تعتمد سرعة توليد الصوت على أجهزتك. يستخدم JBark وحدة المعالجة المركزية للحسابات افتراضيًا. للمعالجة بشكل أسرع ، فكر في استخدام جهاز مع وحدة المعالجة المركزية الأكثر قوة أو تنفيذ دعم GPU.

س: ما مدى فعالية التحويل الصوتي البسيط؟ ج: توفر ميزة تحويل الصوت البسيطة في JBARK تعديلات الملعب والإيقاع الأساسي. على الرغم من أنه يمكن أن يغير بعض الخصائص الصوتية ، إلا أنه لا يوفر نفس المستوى من جودة الاستنساخ الصوتي كطرق أكثر تقدماً. قد تختلف النتائج اعتمادًا على نص الإدخال وخصائص الصوت المستهدفة.

س: كيف يمكنني تحسين جودة تحويل الصوت؟ ج: استخدم عينات صوتية عالية الجودة لاستخراج مميزة الصوت ، من الناحية المثالية مع خطاب واضح وأقل ضوضاء في الخلفية. يمكنك أيضًا تجربة ضبط معلمات تحويل الملعب ومعلمات ضبط الإيقاع في طريقة simple_voice_conversion للحصول على نتائج أفضل.

س: كيف يمكنني استخدام نماذج لغة مختلفة؟ ج: يدعم JBARK لغات متعددة. يمكنك تحديد اللغة المطلوبة عند إنشاء الصوت باستخدام رمز اللغة المناسب في موجه التاريخ. على سبيل المثال:

 audio = jbark . generate_audio ( "Bonjour!" , history_prompt = "v2/fr_speaker_1" )

للحصول على قائمة باللغات المدعومة ورموزها ، استخدم طريقة list_supported_languages() .

لمزيد من الأسئلة والأجوبة ، تفضل بزيارة صفحة قضايا GitHub أو انضم إلى منتدى مجتمعنا.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع كود الذكاء الاصطناعي
وقت التحديث 2025-08-24
الحجم 1.18MB
من Github

تطبيقات ذات صلة

ML stack

2025-07-01
awesome free chatgpt

2025-01-04
pywin_contextmenu

2025-08-31
promptl

2025-02-17
tick.chat

2025-09-16
FastLoRAChat

2025-09-03

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ML stack

كود الذكاء الاصطناعي

1.0.0
awesome free chatgpt

كود الذكاء الاصطناعي

1.0.0
pywin_contextmenu

كود الذكاء الاصطناعي

Version update
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل

jBark