Scribe هو برنامج نصي Python يقوم بتنسخ ملفات الصوت باستخدام Openai Whisper وتصدير النسخ كمستندات PDF ، والتي يتم تعزيزها بواسطة واجهة برمجة تطبيقات GPT-3.5-TURBO. وهو يدعم تنسيقات ملف MP3 و M4A و MP4 كمدخلات وينشئ ملف PDF مع نص النسخ المنسق على صفحة حجم A4. يستخدم البرنامج النصي أيضًا نموذج GPT-3.5-Turbo من Openai لإنشاء عنوان للنسخ.
الميزات تحويل ملفات MP3 و M4A و MP4 إلى تنسيق WAV لنسخ النسخ ملفات الصوت باستخدام طراز ASR Whisper ، قم بإنشاء عنوان للنسخ باستخدام نموذج GPT-3.5-Turbo من Openai ، بما في ذلك ملف PDF بنص النسخ المنسق على صفحة A4 تخصيص نمط إخراج PDF ، بما في ذلك ALVELMENT FONT و FONT
الاستخدام: Python scribev4.py <pection_file>
استبدل <pection_file> بالمسار إلى ملف MP3 أو M4A أو MP4.
سيقوم البرنامج النصي بنسخ ملف الصوت ، وإنشاء عنوان ، وإنشاء ملف PDF في نفس الدليل مثل ملف الإدخال بنفس الاسم ولكن تمديد .pdf.
المتطلبات المسبقة:
تثبيت Whisper: PIP تثبيت git+https: //github.com/openai/whisper.git
تحقق من النماذج المختلفة المتاحة مسبقًا وأدائها على Github's Whisper: https://github.com/openai/whisper
تثبيت تبعيات أخرى: Pydub Openai ReportLab MoviePy
يستخدم نظام الغذاء كاتب Openai API ويخرج txt.
اضبط مفتاح API الخاص بك
تثبيت جميع التبعيات المطلوبة: Pydub ، MoviePy ، Openai
Run: Python Diet-Scripe.py <pection_file>