افتح دفتر Notebooklm

ملخص
تم تصميم برنامج Podcast Creator Script (Open Sourced Booklm) لأتمتة عملية إنشاء بودكاست من مستند PDF. يقوم باستخراج النص من PDF ، ويقوم بإنشاء برنامج نصي بودكاست مفصل باستخدام طراز GPT-4 من Openai ، ويقوم بتحويل البرنامج النصي إلى الصوت ، ثم يجمع الصوت مع صور صفحات PDF لإنشاء مقطع فيديو. يتضمن الإخراج النهائي كلاً من ملف الصوت وملف فيديو مع صوت متزامن.
أمثلة
MISTRAL 7B
Llama2
الانتباه هو كل ما تحتاجه
فتح ميزات NotebookLM من مصادر
- استخراج نص PDF : يستخرج محتوى النص من مستند PDF.
- توليد النصوص : يستخدم نموذج GPT-4 من Openai لإنشاء برنامج نصي بودكاست مفصل استنادًا إلى النص المستخرج.
- تحويل النص إلى كلام : يحول البرنامج النصي الذي تم إنشاؤه إلى صوت باستخدام إمكانيات Openai النص إلى الكلام.
- معالجة الصوت : تقوم بمعالجة الصوت للتأكد من تلبية المواصفات المطلوبة (على سبيل المثال ، ستيريو ، معدل العينة).
- إنشاء الفيديو : يحول صفحات PDF إلى الصور ويجمعها مع الصوت لإنشاء مقطع فيديو.
- تكوين البيئة : يحمل متغيرات البيئة من ملف
.env لإدارة مفتاح API الآمنة.
سير العمل
- استخراج النص من PDF : يبدأ البرنامج النصي عن طريق استخراج النص من ملف PDF المقدم.
- قم بإنشاء برنامج نصي بودكاست : يتم استخدام النص المستخرج لإنشاء برنامج نصي بودكاست يضم مضيفين ، أليس وجون ، اللذين يشاركون في محادثة مفصلة حول المحتوى.
- تحويل البرنامج النصي إلى الصوت : يتم تحويل البرنامج النصي إلى صوت ، مع أصوات مختلفة مخصصة لأليس وجون.
- صوتي العملية : تتم معالجة الصوت للتأكد من أنه بالتنسيق والجودة الصحيحين.
- إنشاء فيديو : يتم إنشاء صور لصفحات PDF ودمجها مع الصوت لإنتاج مقطع فيديو.
- حفظ المخرجات : يتم حفظ ملفات الصوت والفيديو النهائية على مسارات الإخراج المحددة.
كيفية استخدام دفتر Notebooklm المفتوح
لتشغيل المشروع:
- ملء
- لاستخدام البرنامج النصي ، ما عليك سوى توفير المسار إلى ملف PDF وتشغيل البرنامج النصي. سيتعامل البرنامج النصي مع الباقي ، وإنشاء البرنامج النصي للبودكاست ، وتحويله إلى الصوت ، ومعالجة الصوت ، وإنشاء الفيديو.
if name == "main" :
pdf_path = "/path/to/your/pdf/document.pdf"
create_podcast_from_pdf ( pdf_path )
poetry run python podcast_creator/main.py
التبعيات
-
langchain -
pydantic -
openai -
pydub -
fitz (pymupdf) -
numpy -
subprocess -
tqdm -
PIL (وسادة) -
textwrap -
dotenv
تأكد من تثبيت جميع التبعيات قبل تشغيل البرنامج النصي.
خاتمة
يوفر البرنامج النصي Podcast Creator (Open Sourced Booklm) حلاً شاملاً لتحويل مستندات PDF إلى حلقات بودكاست جذابة ، كاملة مع مخرجات الصوت والفيديو. من خلال الاستفادة من نماذج الذكاء الاصطناعى المتقدمة وتقنيات معالجة الصوت ، فإنه يتم أتمتة سير العمل بأكمله ، مما يجعل من السهل إنشاء محتوى بودكاست عالي الجودة من المستندات النصية.
رخصة
دعونا نتحادث ؛)