Podgenai هو تطبيق Python 3.12 لإنشاء ملف MP3 المسموع المسموع المفرد المفرد على موضوع معين باستخدام GPT-4 LLM. المدة المستهدفة للملف الذي تم إنشاؤه هي ساعة ، على الرغم من أن المدة التي تم إنشاؤها تختلف. مطلوب مفتاح API Openai الممولة.
| التسمية التوضيحية | وصلة |
|---|---|
| ريبو | https://github.com/impredicative/podgenai |
| Changelog | https://github.com/impredicative/podgenai/releases |
| طَرد | https://pypi.org/project/podgenai |
| بودكاست | https://podcasters.spotify.com/pod/podgenai |
| بودكاست RSS | https://anchor.fm/s/f4868644/podcast/rss |
يتم استخدام نماذج gpt-4o و tts-1 . بالنسبة لموضوع معين ، فإن النهج المرجعي رفيع المستوى هو:
ffmpeg .على الرغم من أنه قد يكون هناك بعض التكرار الدلالي للمحتوى عبر المواد الدراسية الفرعية ، إلا أنه لم يتم "تحسين" عن قصد لأن هذا التكرار من النقاط المهمة يمكن أن يساعد في التعلم والحفظ. للغوص بشكل أعمق في نطاق فرعي معين ، يمكن للمرء أن يحاول إنشاء ملف جديد له فقط.
تتوفر ملفات MP3 التي تم إنشاؤها للتنزيل. في الواقع ، تشكل هذه أيضًا جناح اختبار يدوي الحد الأدنى ، مع ملاحظة الغرض الفريد من كل عينة. كتذكير ، يتم تحديد الصوت بواسطة LLM.
يوجد أيضًا بودكاست ذي صلة (RSS) يمكن نشر الحلقات حول مواضيع إضافية يدويًا مع مرور الوقت.
يوصى باستخدام سرعة التشغيل البالغة 1.05x للمواضيع غير التقنية ، و 1.0x للمواضيع التقنية ، و 0.95x لمواضيع اللغة الأجنبية.
| صوت | اسم | غاية |
|---|---|---|
| تقصير | Pytorch | توليد المحتوى الفني |
| تقصير | Pytorch المتقدمة | توليد المحتوى التقني المتقدم |
| تقصير | نصائح مقابلة وظيفة مهندس البرمجيات | اختيار الصوت الافتراضي |
| عاطفي | مدينة نيويورك: الحاضر والمستقبل | توليد المحتوى غير الفني |
| عاطفي | العيش حياة جيدة | اختيار الصوت العاطفي |
| تقصير | الذكاء العام الاصطناعي (AGI): النهج والخوارزميات | تطبيق القائمة الفرعية لمستوى واحد غير هرمي |
| أنثى | نظام الدورة الدموية البشرية (غير مقلوب) | دعم موضوع ضمني للاحتياجات غير المألوفة |
| أنثى | بوفاي ذا مصاص الدماء القاتل | اختيار الصوت الأنثوي |
| ذكر | بيتكوين لخطوط المهووسين | اختيار الصوت الذكور |
.env ، مع متغير البيئة المقصود OPENAI_API_KEY=<your OpenAI API key> ، أو تعيينه بطريقة مختلفة.PODGENAI_OPENAI_MAX_WORKERS=32 لتوليد أسرع ، مع قيمته الافتراضية 16.ffmpeg . هذا أوتوماتيكي إذا كان استخدام تعريف DevContainer المضمون.rye ومتاح.rye sync --no-lock .pip install -U podgenai . يمكن أن يكون الاستخدام كتطبيق سطر الأوامر أو كمكتبة Python. بشكل افتراضي ، سيتم كتابة ملف MP3 الذي تم إنشاؤه إلى دليل العمل الحالي. اعتبارًا من عام 2024 ، تكون التكلفة النموذجية لكل جيل هي 1 إلى 2 دولار أمريكي ، وبشكل أكثر تحديداً تحت 0.10 دولار أمريكي لكل مجموعة فرعية. الوقت المستغرق أقل من ثلاث دقائق.
./work/<topic>/1.*.mp3 وتجديد الإخراج.--no-markers .يتم نسخ مساعدة الاستخدام أدناه:
$ python -m podgenai -h
Usage: python -m podgenai [OPTIONS]
Generate and write an audiobook podcast mp3 file for the given topic to the given output file path.
Options:
-t, --topic TEXT Topic. If not given, the user is prompted for it.
-p, --path PATH Output file or directory path. If an intended file path, it must have an ".mp3"
suffix. If a directory, it must exist, and the file name is auto-determined. If not
given, the output file is written to the current working directory with an auto-
determined file name.
-s, --max-sections INTEGER RANGE
Maximum number of sections, between 3 and 100. If not given, it is unrestricted.
[3<=x<=100]
-m, --markers / -nm, --no-markers
Include markers at the start or end of sections in the generated audio. If
`--markers`, markers are included, and this is the default. If `--no-markers`,
markers are excluded, as can be appropriate for foreign-language generation.
-c, --confirm / -nc, --no-confirm
Confirm before full-text and speech generation. If `--confirm`, a confirmation is
interactively sought as each step of the workflow progresses, and this is the
default. If `--no-confirm`, the full-text and speech are generated without
confirmations.
-h, --help Show this message and exit.
أمثلة الاستخدام:
$ python -m podgenai -t "My favorite topic"
$ python -m podgenai -t "My favorite topic" -p ~/Downloads/
$ python -m podgenai -t "My favorite topic" -p ~/Downloads/topic.mp3 -nc
$ python -m podgenai -t "L'histoire de Napoléon Bonaparte (français)" -nm
>> > from podgenai import generate_media
>> > import inspect
>> > print ( inspect . signature ( generate_media ))
( topic : str , * , output_path : Optional [ pathlib . Path ] = None , max_sections : Optional [ int ] = None , markers : bool = True , confirm : bool = False ) - > pathlib . Path
>> > print ( inspect . getdoc ( generate_media )) Return the output path after generating and writing an audiobook podcast to file for the given topic.
Params:
* `topic`: Topic.
* `path`: Output file or directory path.
If an intended file path, it must have an ".mp3" suffix. If a directory, it must exist, and the file name is auto-determined.
If not given, the output file is written to the repo directory with an auto-determined file name.
* `max_sections`: Maximum number of sections to generate. It is between 3 and 100. It is unrestricted if not given.
* `markers`: Include markers at the start or end of sections in the generated audio.
If true, markers are included. If false, markers are excluded, as can be appropriate for foreign-language generation. Its default is true.
* `confirm`: Confirm before full-text and speech generation.
If true, a confirmation is interactively sought after generating and printing the list of subtopics, before generating the full-text, and also before generating the speech. Its default is false.
If failed, a subclass of the `podgenai.exceptions.Error` exception is raised.
يتم تخزين مقاطع النص والكلام محليًا على القرص في ./work/<topic> . يمكن حذفها يدويًا. هذا الحذف ليس تلقائيًا حاليًا. علاوة على ذلك ، قد يكون من الضروري حاليًا حذف ملفات مؤقتة مؤقتة واحدة أو أكثر إذا تم تجاوز ذاكرة التخزين المؤقت.
يتم توفير هذا البرنامج "كما هو" ، دون أي ضمان من أي نوع ، صريح أو ضمني ، بما في ذلك على سبيل المثال لا الحصر ضمانات القابلية للتسويق ، واللياقة لغرض معين ، وعدم التنقل. لا يجوز بأي حال من الأحوال أن يكون المؤلفون أو حاملي حقوق الطبع والنشر مسؤولين عن أي مطالبة أو أضرار أو مسؤولية أخرى ، سواء في إجراء عقد أو ضرر أو غير ذلك ، ناشئ عن أو خارج أو فيما يتعلق بالبرنامج أو الاستخدام أو غيرها من المعاملات في البرنامج.
يجب أن يكون المستخدمون على دراية بأن كل من النص وصوت الملفات التي تم إنشاؤها يتم إنتاجها بواسطة الذكاء الاصطناعي (AI) بناءً على المدخلات المقدمة والبيانات المتاحة لنموذج الذكاء الاصطناعي في وقت التوليد. على هذا النحو ، قد تحدث عدم الدقة أو الأخطاء أو المحتوى غير المقصود. يُنصح المستخدمون بممارسة الحذر والتحقق من دقة ومدى ملاءمة المحتوى الذي تم إنشاؤه قبل أي استخدام أو اعتماد.
أنت مسؤول عن التكاليف المرتبطة باستخدام واجهة برمجة تطبيقات Openai كما هو مطلوب من قبل البرنامج ، ويجب أن تمتثل لشروط خدمة Openai API. تعتمد وظيفة البرنامج على توافر ووظائف الخدمات والبرامج الخارجية ، بما في ذلك على سبيل المثال لا الحصر ، Openai API و FFMPEG ، والتي لا يتحكم فيها المؤلفون.
يجب أن يتوافق استخدام مفتاح Openai API وأي محتوى تم إنشاؤه لجميع القوانين واللوائح المعمول بها ، بما في ذلك قوانين حقوق الطبع والنشر وشروط خدمة Openai. أنت وحدك مسؤول عن ضمان أن استخدامك للبرنامج وأي محتوى تم إنشاؤه يتوافق مع شروط الخدمة OpenAI وأي قوانين ولوائح أخرى قابلة للتطبيق.
تم ترخيص هذا البرنامج بموجب ترخيص GNU Lesser General Public (LGPL) ، والذي يسمح بالاستخدام الخاص والتجاري والتعديل والتوزيع ، وفقًا للشروط والأحكام الموضحة في LGPL. يجب أن تكون قد تلقيت نسخة من رخصة GNU Lesser العامة إلى جانب هذا البرنامج. إذا لم يكن الأمر كذلك ، راجع http://www.gnu.org/licenses/.
لا يدعي المؤلفون ملكية أي محتوى تم إنشاؤه باستخدام هذا البرنامج. مسؤولية استخدام أي وجميع المحتوى الذي تم إنشاؤه مع المستخدم. يجب على المستخدمين توخي الحذر والخداع الواجب لضمان عدم انتهاك المحتوى الذي تم إنشاؤه لحقوق أطراف ثالثة.
يخضع إخلاء المسئولية هذا للتغيير دون إشعار. تقع على عاتقك مسؤولية مراجعتها بشكل دوري للحصول على التحديثات.