تنزيل podcast_tts - تنزيل رمز المصدر podcast

podcast_tts

كود الذكاء الاصطناعي

1.0.0

تنزيل

بودكاست TTS

podcast_tts هي مكتبة Python لإنشاء بودكاست وحوارات باستخدام النص إلى كلام (TTS). وهو يدعم العديد من المتحدثين وموسيقى الخلفية وخلط الصوت الدقيق لنتائج جودة المهنية.

مثال بودكاست

يمكنك الاستماع إلى مثال البودكاست أدناه:

مثال podcast_01.mp4

سمات

دعم متعدد المتحدثين : قم بإنشاء حوارات مع ملفات تعريف مميزة للسماعات.
أصوات Premade : استخدم ملفات تعريف مكبرات الصوت Premade (Male1 ، Male2 ، Female2) المدرجة في المكتبة أو إنشاء ملفات تعريف مخصصة.
توليد مكبرات الصوت الديناميكي : يقوم تلقائيًا بإنشاء ملفات تعريف مكبرات صوت جديدة إذا لم يكن المتحدث المحدد موجودًا ، مما يوفر الملامح في المجلد الفرعي voices للاستخدام في المستقبل.
تعيين الدور المتسق : يضمن الاتساق من خلال تعيين ملامح السماعات وإعادة استخدامها بناءً على اسم المتحدث.
التشغيل الخاص بالقناة : يسمح بتشغيل الصوت على اليسار أو اليمين أو كلتا القنتين للفصل المكاني.
تطبيع النص : تطبيع النص تلقائيًا ، ومقبض الانقباضات ، وتنسيق الحالات الخاصة.
تكامل الموسيقى الخلفية : أضف موسيقى الخلفية مع تلاشي في/خارج والتحكم في مستوى الصوت.
دعم MP3 و URL : استخدم ملفات MP3/WAV المحلية أو تنزيل الموسيقى من عنوان URL مع التخزين المؤقت.
تنسيقات الإخراج : حفظ الصوت الذي تم إنشاؤه كملفات WAV أو MP3.

تثبيت

 # ensure to have sox, or ffmpeg installed
brew install sox
# install the package
pip install podcast_tts

الاستخدام

توليد الصوت لمتحدث واحد

 import asyncio
from podcast_tts import PodcastTTS

async def main ():
    tts = PodcastTTS ( speed = 5 )
    await tts . generate_tts (
        text = "Hello! Welcome to our podcast." ,
        speaker = "male1" ,
        filename = "output_audio.wav" ,
        channel = "both"
    )

if __name__ == "__main__" :
    asyncio . run ( main ())

مثال: إنشاء بودكاست مع الموسيقى

تجمع طريقة CONRERATE_PODCAST بين الحوار وموسيقى الخلفية لإنتاج بودكاست سلس.

 import asyncio
from podcast_tts import PodcastTTS

async def main ():
    tts = PodcastTTS ( speed = 5 )

    # Define speakers and text
    texts = [
        { "male1" : [ "Welcome to the podcast!" , "both" ]},
        { "female2" : [ "Today, we discuss AI advancements." , "left" ]},
        { "male2" : [ "Don't miss our exciting updates." , "right" ]},
    ]

    # Define background music (local file or URL)
    music_config = [ "https://example.com/background_music.mp3" , 10 , 3 , 0.3 ]

    # Generate the podcast
    output_file = await tts . generate_podcast (
        texts = texts ,
        music = music_config ,
        filename = "podcast_with_music.mp3" ,
        pause_duration = 0.5 ,
        normalize = True
    )

    print ( f"Podcast saved to: { output_file } " )

if __name__ == "__main__" :
    asyncio . run ( main ())

تكوين الموسيقى:

[ملف/url ، full_volume_duration ، fade_duration ، target_volume]
- ملف/url : مسار إلى ملف MP3/WAV محلي أو عنوان URL للتنزيل.
- full_volume_duration : الوقت (ثواني) في الحجم الكامل قبل بدء الحوار وبعد النهايات.
- Fade_duration : الوقت (ثواني) للتأثيرات في/الخروج.
- Target_volum E: مستوى الصوت (0.0 إلى 1.0) أثناء تشغيل الحوار.

أصوات مسبق

يتضمن Podcasttts ملفات تعريف السماعات الممتدة التالية:

male1
male2
أنثى 2

يتم تضمين هذه الملفات الشخصية في دليل Default_Voices الخاص بالحزمة ويمكن استخدامه بدون إعداد إضافي.

جيل المتحدث الديناميكي

عندما يتم تحديد ملف تعريف السماعة ولكنه غير موجود ، ستقوم المكتبة تلقائيًا بإنشاء ملف تعريف مكبر صوت جديد وحفظه في المجلد الفرعي للأصوات. هذا يضمن أدوار صوتية متسقة عبر المنعطفات المختلفة في حوار. على سبيل المثال:

 texts = [
    { "Narrator" : [ "Welcome to this exciting episode." , "left" ]},
    { "Expert" : [ "Today, we'll explore AI's impact on healthcare." , "right" ]},
]
# If "Narrator" or "Expert" profiles do not exist, they will be generated dynamically.

يتم حفظ الملفات الشخصية في دليل أصوات البرنامج النصي وإعادة استخدامها تلقائيًا إذا تم استخدام نفس السماعة في المستقبل من أجل الاتساق.

تحميل ملفات تعريف السماعات الموجودة

يمكنك تحميل أي ملف تعريف مكبر صوت عن طريق تحديد اسم الملف (بدون امتداد .txt). يتم تخزين الملفات الشخصية في المجلد الفرعي للأصوات ، لذلك لا تحتاج إلى تحديد المسار بشكل صريح.

 # Assuming a speaker profile "Host.txt" exists in the voices subfolder
await tts . generate_tts ( "This is a test for an existing speaker." , "Host" , "existing_speaker.wav" )

ملاحظات إضافية

تستخدم المكتبة chattts لتوليد TTS عالي الجودة.
يتم تنظيف النص تلقائيًا وتقسيمه إلى أجزاء يمكن التحكم فيها ، مما يجعل من السهل إنشاء الصوت للنصوص الطويلة أو المحادثات.
يتم حفظ الملفات الصوتية التي تم إنشاؤها بتنسيق WAV ، مع دعم التشغيل الخاص بالقناة.