Scribe adalah skrip Python yang menyalin file audio menggunakan openai Whisper dan mengekspor transkripsi sebagai dokumen PDF, ditingkatkan oleh API GPT-3.5-turbo. Ini mendukung format file MP3, M4A, dan MP4 sebagai input dan menghasilkan file PDF dengan teks transkripsi diformat pada halaman ukuran A4. Skrip ini juga menggunakan model GPT-3.5-turbo Openai untuk menghasilkan judul untuk transkripsi.
Fitur Konversi MP3, M4A, dan File MP4 ke WAV Format untuk transkripsi file audio transkripsi menggunakan model ASR Whisper menghasilkan judul untuk transkripsi menggunakan model OpenAI GPT-3.5-Turbo Buat file PDF dengan ukuran teks transkripsi pada ukuran halaman A4 yang menyesuaikan gaya output PDF, termasuk alignmen teks dan font aligna dan font font yang disesuaikan dengan output PDF, termasuk alignmen teks dan font output dan font output dan font output dan font output dan font
Penggunaan: python scribev4.py <input_file>
Ganti <sput_file> dengan jalur ke file MP3, M4A, atau MP4 Anda.
Script akan menuliskan file audio, menghasilkan judul, dan membuat file PDF di direktori yang sama dengan file input dengan nama yang sama tetapi ekstensi .pdf.
Prasyarat:
Instal Whisper: Pip Instal Git+https: //github.com/openai/whisper.git
Lihat berbagai model pra-terlatih yang tersedia dan kinerjanya di GitHub Whisper: https://github.com/openai/whisper
Instal Dependensi Lainnya: Pydub OpenAi ReportLab MoviePy
Diet Scribe menggunakan OpenAI API dan mengeluarkan txt.
Atur kunci API Anda
Instal semua dependensi yang diperlukan: pydub, moviePy, openai
Jalankan: Python diet-scribe.py <input_file>