بودفاي
يتيح هذا التطبيق للمستخدم إنشاء محتوى بأسلوب البودكاست بناءً على الملفات المقدمة. بعض الأمثلة ستوفر ورقة أو محاضرة أو وصف للمشروع أو السيرة الذاتية الشخصية أو العديد من المناطق الأخرى.
لقد كتبت أيضًا منشورًا للمدونة للحديث عن هذا المشروع ، تأكد من التحقق من " كيفية استخدام AI Generation لإنشاء محتوى على طراز البودكاست من أي إدخال ".
كيف تعمل

كيفية استخدام
- توفير ملف واحد أو أكثر.
- اختياريا ، تخصيص أصوات الضيف والمضيف ، يمكنك الاطلاع على عينات الصوت هنا.
- انقر فوق "إنشاء البودكاست" وانتظر بضع لحظات.
- قم بتشغيل الصوت ، ولا تتردد في المتابعة على طول النص النصي.
أمثلة

توليد البودكاست من مشروعي الآخر "AI Beats"
Podcast-Ai_beast.mp4
توليد البودكاست من مشروعي الآخر "AI Trailer"
podcast-ai_trailer.mp4
توليد البودكاست من وصف أندرو هوبيرمان "الروتيني" في الصباح الأمثل "
Podcast-Andrew_hubermans.mp4
بودكاست توليد سيرة ذاتية شخصية
بودكاست- resume.mp4
الاستخدام المحلي
يثبت
- استنساخ مستودع جيثب
https://github.com/dimitreOliveira/PodfAI.git
cd PodfAI
- إنشاء VenV جديد
python -m venv .venvs/podfai
- تنشيط VenV
source .venvs/podfai/bin/activate
- تثبيت المتطلبات
بدلاً من ذلك ، يمكنك أيضًا تشغيل pip
pip install -r requirements
- قم بإعداد تبعيات Google API
- اتبع هذا الدليل أو هذا الدليل الآخر.
تشغيل التطبيق
لبدء التطبيق ، قم بتشغيل الأمر Make أدناه
بدلاً من ذلك ، يمكنك أيضًا التشغيل باستخدام Python العادي
streamlit run src / app . py
التكوينات
لا تتردد في تغيير التكوينات الافتراضية لتغيير سلوك التطبيق أو التكيف مع احتياجاتك.
vertex:
project: {VERTEX_AI_PROJECT}
location: {VERTEX_AI_LOCATION}
transcript:
model_id: gemini-1.5-pro-002
transcript_len: 5000
max_output_tokens: 8192
temperature: 1
top_p: 0.95
top_k: 32
- قمة الرأس
- المشروع: اسم المشروع المستخدمة بواسطة Vertex AI.
- الموقع: موقع المشروع المستخدمة بواسطة Vertex AI.
- نص
- Model_id: نموذج يستخدم لإنشاء نسخة بودكاست.
- transcript_len: طول النص المقترح.
- max_output_tokens: الحد الأقصى لعدد الرموز الناتجة عن النموذج.
- درجة الحرارة: درجة الحرارة تتحكم في درجة العشوائية في اختيار الرمز المميز. تعد درجات الحرارة المنخفضة جيدة للمطالبات التي تتوقع استجابة حقيقية أو صحيحة ، في حين أن درجات الحرارة الأعلى يمكن أن تؤدي إلى نتائج أكثر تنوعًا أو غير متوقعة. مع درجة حرارة 0 يتم اختيار الرمز المميز لأعلى احتمال دائمًا
- TOP_P: يغير TOP-P كيف يختار النموذج الرموز للإخراج. يتم اختيار الرموز من أكثر من المحتمل إلى الأقل حتى يساوي مجموع احتمالاتها قيمة أعلى p. على سبيل المثال ، إذا كان لدى الرموز A و B و C احتمال 0.3 و .2 و .1 وقيمة أعلى p هي .5 ، فسيتم تحديد النموذج إما A أو B كرمز مميز التالي (باستخدام درجة الحرارة)
- TOP_K: يغير TOP-K كيف يختار النموذج الرموز للإخراج. يعني أعلى K من 1 أن الرمز المميز المحدد هو الأكثر احتمالا بين جميع الرموز في مفردات النموذج (تسمى أيضًا فك تشفير الجشع) ، في حين أن أعلى K من 3 يعني أن الرمز المميز التالي يتم تحديده من بين الرموز الثلاثة الأكثر احتمالًا (باستخدام درجة الحرارة)
تودو
- دعم استنساخ الصوت
- دعم اللغات الأخرى
- دعم أنواع الإدخال الأخرى (الصور ، مقاطع الفيديو ، عناوين URL على YouTube)
- أضف مثال دفتر الملاحظات لتشغيله في كولاب
- إعادة إنتاج سير العمل مع نماذج مفتوحة المصدر
- تجربة مع سير عمل الوكيل لتحسين نسخة البودكاست
مراجع
- Google Cloud-مكتبات عميل النص إلى كلام
- إعداد Google Cloud TTS محليًا
- قائمة صوتية Google Cloud TTS
المساهمة
إذا كنت مهتمًا بالمساهمة في هذا المشروع ، شكرًا جزيلاً! قبل إنشاء العلاقات العامة الخاصة بك ، تأكد من ترتبات الكود الخاص بك ، وتشغيل الأمر أدناه:
شكر وتقدير
- يتم توفير الاعتمادات السحابية من Google لهذا المشروع. كان هذا المشروع ممكنًا بفضل دعم فريق برامج مطور ML من Google.
- استند هذا المشروع إلى NotebookLM من Google ، والذي ، إلى جانب المحتوى على غرار البودكاست ، يحتوي على العديد من الميزات الأخرى ، تأكد من التحقق من ذلك.