podcast_tts هي مكتبة Python لإنشاء بودكاست وحوارات باستخدام النص إلى كلام (TTS). وهو يدعم العديد من المتحدثين وموسيقى الخلفية وخلط الصوت الدقيق لنتائج جودة المهنية.
يمكنك الاستماع إلى مثال البودكاست أدناه:
voices للاستخدام في المستقبل. # ensure to have sox, or ffmpeg installed
brew install sox
# install the package
pip install podcast_tts import asyncio
from podcast_tts import PodcastTTS
async def main ():
tts = PodcastTTS ( speed = 5 )
await tts . generate_tts (
text = "Hello! Welcome to our podcast." ,
speaker = "male1" ,
filename = "output_audio.wav" ,
channel = "both"
)
if __name__ == "__main__" :
asyncio . run ( main ())تجمع طريقة CONRERATE_PODCAST بين الحوار وموسيقى الخلفية لإنتاج بودكاست سلس.
import asyncio
from podcast_tts import PodcastTTS
async def main ():
tts = PodcastTTS ( speed = 5 )
# Define speakers and text
texts = [
{ "male1" : [ "Welcome to the podcast!" , "both" ]},
{ "female2" : [ "Today, we discuss AI advancements." , "left" ]},
{ "male2" : [ "Don't miss our exciting updates." , "right" ]},
]
# Define background music (local file or URL)
music_config = [ "https://example.com/background_music.mp3" , 10 , 3 , 0.3 ]
# Generate the podcast
output_file = await tts . generate_podcast (
texts = texts ,
music = music_config ,
filename = "podcast_with_music.mp3" ,
pause_duration = 0.5 ,
normalize = True
)
print ( f"Podcast saved to: { output_file } " )
if __name__ == "__main__" :
asyncio . run ( main ())يتضمن Podcasttts ملفات تعريف السماعات الممتدة التالية:
يتم تضمين هذه الملفات الشخصية في دليل Default_Voices الخاص بالحزمة ويمكن استخدامه بدون إعداد إضافي.
عندما يتم تحديد ملف تعريف السماعة ولكنه غير موجود ، ستقوم المكتبة تلقائيًا بإنشاء ملف تعريف مكبر صوت جديد وحفظه في المجلد الفرعي للأصوات. هذا يضمن أدوار صوتية متسقة عبر المنعطفات المختلفة في حوار. على سبيل المثال:
texts = [
{ "Narrator" : [ "Welcome to this exciting episode." , "left" ]},
{ "Expert" : [ "Today, we'll explore AI's impact on healthcare." , "right" ]},
]
# If "Narrator" or "Expert" profiles do not exist, they will be generated dynamically.يتم حفظ الملفات الشخصية في دليل أصوات البرنامج النصي وإعادة استخدامها تلقائيًا إذا تم استخدام نفس السماعة في المستقبل من أجل الاتساق.
يمكنك تحميل أي ملف تعريف مكبر صوت عن طريق تحديد اسم الملف (بدون امتداد .txt). يتم تخزين الملفات الشخصية في المجلد الفرعي للأصوات ، لذلك لا تحتاج إلى تحديد المسار بشكل صريح.
# Assuming a speaker profile "Host.txt" exists in the voices subfolder
await tts . generate_tts ( "This is a test for an existing speaker." , "Host" , "existing_speaker.wav" )المساهمات مرحب بها! لا تتردد في تقديم المشكلات أو سحب الطلبات على مستودع GitHub.
هذا المشروع مرخص بموجب ترخيص معهد ماساتشوستس للتكنولوجيا. انظر ملف الترخيص للحصول على التفاصيل.