تنزيل podgenai - تنزيل رمز المصدر podgenai

podgenai

شفرة المصدر الأخرى

0.8.0

تنزيل

Podgenai

Podgenai هو تطبيق Python 3.12 لإنشاء ملف MP3 المسموع المسموع المفرد المفرد على موضوع معين باستخدام GPT-4 LLM. المدة المستهدفة للملف الذي تم إنشاؤه هي ساعة ، على الرغم من أن المدة التي تم إنشاؤها تختلف. مطلوب مفتاح API Openai الممولة.

الروابط

التسمية التوضيحية	وصلة
ريبو	https://github.com/impredicative/podgenai
Changelog	https://github.com/impredicative/podgenai/releases
طَرد	https://pypi.org/project/podgenai
بودكاست	https://podcasters.spotify.com/pod/podgenai
بودكاست RSS	https://anchor.fm/s/f4868644/podcast/rss

يقترب

يتم استخدام نماذج gpt-4o و tts-1 . بالنسبة لموضوع معين ، فإن النهج المرجعي رفيع المستوى هو:

يتم سرد المواطن الفرعية المعمول بها باستخدام LLM. ومع ذلك ، إذا كان الموضوع غير معروف لـ LLM ، فسيتم إحباط العملية.
يتم تحديد الصوت باستخدام LLM من أربعة خيارات.
بشكل متزامن لكل نطاق فرعي ، يتم إنشاء النص والكلام المقابل باستخدام LLM و TTS على التوالي.
يتم تسلسل ملفات الكلام باستخدام ffmpeg .

على الرغم من أنه قد يكون هناك بعض التكرار الدلالي للمحتوى عبر المواد الدراسية الفرعية ، إلا أنه لم يتم "تحسين" عن قصد لأن هذا التكرار من النقاط المهمة يمكن أن يساعد في التعلم والحفظ. للغوص بشكل أعمق في نطاق فرعي معين ، يمكن للمرء أن يحاول إنشاء ملف جديد له فقط.

عينات

تتوفر ملفات MP3 التي تم إنشاؤها للتنزيل. في الواقع ، تشكل هذه أيضًا جناح اختبار يدوي الحد الأدنى ، مع ملاحظة الغرض الفريد من كل عينة. كتذكير ، يتم تحديد الصوت بواسطة LLM.

يوجد أيضًا بودكاست ذي صلة (RSS) يمكن نشر الحلقات حول مواضيع إضافية يدويًا مع مرور الوقت.

يوصى باستخدام سرعة التشغيل البالغة 1.05x للمواضيع غير التقنية ، و 1.0x للمواضيع التقنية ، و 0.95x لمواضيع اللغة الأجنبية.

صوت	اسم	غاية
تقصير	Pytorch	توليد المحتوى الفني
تقصير	Pytorch المتقدمة	توليد المحتوى التقني المتقدم
تقصير	نصائح مقابلة وظيفة مهندس البرمجيات	اختيار الصوت الافتراضي
عاطفي	مدينة نيويورك: الحاضر والمستقبل	توليد المحتوى غير الفني
عاطفي	العيش حياة جيدة	اختيار الصوت العاطفي
تقصير	الذكاء العام الاصطناعي (AGI): النهج والخوارزميات	تطبيق القائمة الفرعية لمستوى واحد غير هرمي
أنثى	نظام الدورة الدموية البشرية (غير مقلوب)	دعم موضوع ضمني للاحتياجات غير المألوفة
أنثى	بوفاي ذا مصاص الدماء القاتل	اختيار الصوت الأنثوي
ذكر	بيتكوين لخطوط المهووسين	اختيار الصوت الذكور

يثبت

الإعداد المشترك

في دليل العمل ، قم بإنشاء ملف يسمى .env ، مع متغير البيئة المقصود OPENAI_API_KEY=<your OpenAI API key> ، أو تعيينه بطريقة مختلفة.
اختياريًا قم أيضًا بتعيين متغير البيئة PODGENAI_OPENAI_MAX_WORKERS=32 لتوليد أسرع ، مع قيمته الافتراضية 16.
تأكد من توفر ffmpeg . هذا أوتوماتيكي إذا كان استخدام تعريف DevContainer المضمون.
تابع الإعداد عبر github أو pypi على النحو التالي.

الإعداد عبر github باستخدام DevContainer

تابع من خطوات الإعداد المشتركة.
استنساخ أو تنزيل هذا الريبو.
بناء وتوفير DevContainer المحددة.

الإعداد عبر جيثب يدويًا

تابع من خطوات الإعداد المشتركة.
استنساخ أو تنزيل هذا الريبو.
تأكد من تثبيت rye ومتاح.
في دليل repo ، قم بتشغيل rye sync --no-lock .

الإعداد عبر PYPI

تابع من خطوات الإعداد المشتركة.
قم بإنشاء وتفعيل Python 3.12 DevContainer أو بيئة افتراضية.
التثبيت عبر PYPI: pip install -U podgenai .

الاستخدام

يمكن أن يكون الاستخدام كتطبيق سطر الأوامر أو كمكتبة Python. بشكل افتراضي ، سيتم كتابة ملف MP3 الذي تم إنشاؤه إلى دليل العمل الحالي. اعتبارًا من عام 2024 ، تكون التكلفة النموذجية لكل جيل هي 1 إلى 2 دولار أمريكي ، وبشكل أكثر تحديداً تحت 0.10 دولار أمريكي لكل مجموعة فرعية. الوقت المستغرق أقل من ثلاث دقائق.

نصائح الاستخدام

إذا فشل موضوع مطلوب في إنشاء نطاقات فرعية بسبب رفض ، فاحرص على ما يصل إلى عدة مرات ، حيث قد ينجح مع عدة محاولات. إذا لم يكن الأمر كذلك ، فحاول إعادة صياغته ، وربما تكون أوسع أو أضيق أو أكثر واقعية. تتم ما يصل إلى محاولتين لكل شوط ، على الرغم من أن المحاولة الأولى ستعيد استخدام ذاكرة التخزين المؤقت للقرص إذا كانت متوفرة.
للحصول على قائمة أطول محتملة من المواد الدراسية الفرعية المغطاة ، فكر في إلحاق اللاحقة "(Unabridged)" بالموضوع المطلوب ، على سبيل المثال "Pytorch (unabridged)".
في حال فشل الموضوع في التحدث في بداية البودكاست ، حذف ./work/<topic>/1.*.mp3 وتجديد الإخراج.
لإنشاء صورة فنية غلاف لموضوعك اختياريًا ، يمكن استخدام GPT المخصص هذا.
لمحاولة توليد لغة أجنبية ، حدد العنوان باللغة المطلوبة إلى جانب بادئة أقواس لاسم اللغة ، على سبيل المثال "México (Español)". إذا تم رفض الجيل في المرة الأولى ، فحاول مرة أخرى. الرجوع أيضًا إلى خيار --no-markers .

الاستخدام كتطبيق

يتم نسخ مساعدة الاستخدام أدناه:

 $ python -m podgenai -h
Usage: python -m podgenai [OPTIONS]

  Generate and write an audiobook podcast mp3 file for the given topic to the given output file path.

Options:
  -t, --topic TEXT                Topic. If not given, the user is prompted for it.
  -p, --path PATH                 Output file or directory path. If an intended file path, it must have an ".mp3"
                                  suffix. If a directory, it must exist, and the file name is auto-determined. If not
                                  given, the output file is written to the current working directory with an auto-
                                  determined file name.
  -s, --max-sections INTEGER RANGE
                                  Maximum number of sections, between 3 and 100. If not given, it is unrestricted.
                                  [3<=x<=100]
  -m, --markers / -nm, --no-markers
                                  Include markers at the start or end of sections in the generated audio. If
                                  `--markers`, markers are included, and this is the default. If `--no-markers`,
                                  markers are excluded, as can be appropriate for foreign-language generation.
  -c, --confirm / -nc, --no-confirm
                                  Confirm before full-text and speech generation. If `--confirm`, a confirmation is
                                  interactively sought as each step of the workflow progresses, and this is the
                                  default. If `--no-confirm`, the full-text and speech are generated without
                                  confirmations.
  -h, --help                      Show this message and exit.

أمثلة الاستخدام:

 $ python -m podgenai -t "My favorite topic"

$ python -m podgenai -t "My favorite topic" -p ~/Downloads/

$ python -m podgenai -t "My favorite topic" -p ~/Downloads/topic.mp3 -nc

$ python -m podgenai -t "L'histoire de Napoléon Bonaparte (français)" -nm

الاستخدام كمكتبة

 >> > from podgenai import generate_media
>> > import inspect

>> > print ( inspect . signature ( generate_media ))
( topic : str , * , output_path : Optional [ pathlib . Path ] = None , max_sections : Optional [ int ] = None , markers : bool = True , confirm : bool = False ) - > pathlib . Path

>> > print ( inspect . getdoc ( generate_media ))

 Return the output path after generating and writing an audiobook podcast to file for the given topic.

Params:
* `topic`: Topic.
* `path`: Output file or directory path.
    If an intended file path, it must have an ".mp3" suffix. If a directory, it must exist, and the file name is auto-determined.
    If not given, the output file is written to the repo directory with an auto-determined file name.
* `max_sections`: Maximum number of sections to generate. It is between 3 and 100. It is unrestricted if not given.
* `markers`: Include markers at the start or end of sections in the generated audio.
    If true, markers are included. If false, markers are excluded, as can be appropriate for foreign-language generation. Its default is true.
* `confirm`: Confirm before full-text and speech generation.
    If true, a confirmation is interactively sought after generating and printing the list of subtopics, before generating the full-text, and also before generating the speech. Its default is false.

If failed, a subclass of the `podgenai.exceptions.Error` exception is raised.

مخبأ

يتم تخزين مقاطع النص والكلام محليًا على القرص في ./work/<topic> . يمكن حذفها يدويًا. هذا الحذف ليس تلقائيًا حاليًا. علاوة على ذلك ، قد يكون من الضروري حاليًا حذف ملفات مؤقتة مؤقتة واحدة أو أكثر إذا تم تجاوز ذاكرة التخزين المؤقت.

تنصل

_{يتم توفير هذا البرنامج "كما هو" ، دون أي ضمان من أي نوع ، صريح أو ضمني ، بما في ذلك على سبيل المثال لا الحصر ضمانات القابلية للتسويق ، واللياقة لغرض معين ، وعدم التنقل. لا يجوز بأي حال من الأحوال أن يكون المؤلفون أو حاملي حقوق الطبع والنشر مسؤولين عن أي مطالبة أو أضرار أو مسؤولية أخرى ، سواء في إجراء عقد أو ضرر أو غير ذلك ، ناشئ عن أو خارج أو فيما يتعلق بالبرنامج أو الاستخدام أو غيرها من المعاملات في البرنامج.}

_{يجب أن يكون المستخدمون على دراية بأن كل من النص وصوت الملفات التي تم إنشاؤها يتم إنتاجها بواسطة الذكاء الاصطناعي (AI) بناءً على المدخلات المقدمة والبيانات المتاحة لنموذج الذكاء الاصطناعي في وقت التوليد. على هذا النحو ، قد تحدث عدم الدقة أو الأخطاء أو المحتوى غير المقصود. يُنصح المستخدمون بممارسة الحذر والتحقق من دقة ومدى ملاءمة المحتوى الذي تم إنشاؤه قبل أي استخدام أو اعتماد.}

_{أنت مسؤول عن التكاليف المرتبطة باستخدام واجهة برمجة تطبيقات Openai كما هو مطلوب من قبل البرنامج ، ويجب أن تمتثل لشروط خدمة Openai API. تعتمد وظيفة البرنامج على توافر ووظائف الخدمات والبرامج الخارجية ، بما في ذلك على سبيل المثال لا الحصر ، Openai API و FFMPEG ، والتي لا يتحكم فيها المؤلفون.}

_{يجب أن يتوافق استخدام مفتاح Openai API وأي محتوى تم إنشاؤه لجميع القوانين واللوائح المعمول بها ، بما في ذلك قوانين حقوق الطبع والنشر وشروط خدمة Openai. أنت وحدك مسؤول عن ضمان أن استخدامك للبرنامج وأي محتوى تم إنشاؤه يتوافق مع شروط الخدمة OpenAI وأي قوانين ولوائح أخرى قابلة للتطبيق.}

_{تم ترخيص هذا البرنامج بموجب ترخيص GNU Lesser General Public (LGPL) ، والذي يسمح بالاستخدام الخاص والتجاري والتعديل والتوزيع ، وفقًا للشروط والأحكام الموضحة في LGPL. يجب أن تكون قد تلقيت نسخة من رخصة GNU Lesser العامة إلى جانب هذا البرنامج. إذا لم يكن الأمر كذلك ، راجع http://www.gnu.org/licenses/.}

_{لا يدعي المؤلفون ملكية أي محتوى تم إنشاؤه باستخدام هذا البرنامج. مسؤولية استخدام أي وجميع المحتوى الذي تم إنشاؤه مع المستخدم. يجب على المستخدمين توخي الحذر والخداع الواجب لضمان عدم انتهاك المحتوى الذي تم إنشاؤه لحقوق أطراف ثالثة.}

_{يخضع إخلاء المسئولية هذا للتغيير دون إشعار. تقع على عاتقك مسؤولية مراجعتها بشكل دوري للحصول على التحديثات.}

يوسع

معلومات إضافية

الإصدار 0.8.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-03-01
الحجم 40.67KB
من Github

تطبيقات ذات صلة

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

شفرة المصدر الأخرى

1.0.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

شفرة المصدر الأخرى

1.0.0

أخبار ذات صلة الكل