Open Sumber Notebooklm

Ringkasan
Skrip pembuat podcast (notebooklm bersumber terbuka) dirancang untuk mengotomatiskan proses pembuatan podcast dari dokumen PDF. Ini mengekstrak teks dari PDF, menghasilkan skrip podcast terperinci menggunakan model GPT-4 OpenAI, mengubah skrip menjadi audio, dan kemudian menggabungkan audio dengan gambar halaman PDF untuk membuat video. Output akhir mencakup file audio dan file video dengan audio yang disinkronkan.
Contoh
Mistral 7B
Llama2
Perhatian adalah semua yang Anda butuhkan
fitur notebooklm bersumber terbuka
- Ekstraksi Teks PDF : Mengekstrak konten teks dari dokumen PDF.
- Pembuatan Skrip : Menggunakan model GPT-4 OpenAI untuk menghasilkan skrip podcast terperinci berdasarkan teks yang diekstraksi.
- Konversi Teks-ke-Pidato : Mengubah skrip yang dihasilkan menjadi audio menggunakan kemampuan teks-ke-pidato openai.
- Pemrosesan Audio : Memproses audio untuk memastikannya memenuhi spesifikasi yang diinginkan (misalnya, stereo, laju sampel).
- Pembuatan Video : Mengubah halaman PDF menjadi gambar dan menggabungkannya dengan audio untuk membuat video.
- Konfigurasi Lingkungan : Memuat variabel lingkungan dari file
.env untuk manajemen kunci API yang aman.
Alur kerja
- Ekstrak Teks dari PDF : Skrip dimulai dengan mengekstraksi teks dari file PDF yang disediakan.
- Generasi skrip podcast : Teks yang diekstraksi digunakan untuk menghasilkan skrip podcast yang menampilkan dua host, Alice dan John, yang terlibat dalam percakapan terperinci tentang konten tersebut.
- Konversi skrip ke audio : skrip dikonversi ke audio, dengan suara berbeda yang ditugaskan untuk Alice dan John.
- Audio Proses : Audio diproses untuk memastikannya dalam format dan kualitas yang benar.
- Buat video : Gambar halaman PDF dibuat dan dikombinasikan dengan audio untuk menghasilkan video.
- Simpan output : File audio dan video akhir disimpan ke jalur output yang ditentukan.
Cara menggunakan notebooklm bersumber terbuka
Untuk menjalankan proyek:
- Isi file .env
- Untuk menggunakan skrip, cukup berikan jalur ke file PDF dan jalankan skrip. Skrip akan menangani sisanya, menghasilkan skrip podcast, mengubahnya menjadi audio, memproses audio, dan membuat video.
if name == "main" :
pdf_path = "/path/to/your/pdf/document.pdf"
create_podcast_from_pdf ( pdf_path )
poetry run python podcast_creator/main.py
Dependensi
-
langchain -
pydantic -
openai -
pydub -
fitz (pymupdf) -
numpy -
subprocess -
tqdm -
PIL (bantal) -
textwrap -
dotenv
Pastikan semua dependensi diinstal sebelum menjalankan skrip.
Kesimpulan
Script Podcast Creator (Open Sumber NotebookLM) menyediakan solusi komprehensif untuk mengubah dokumen PDF menjadi episode podcast yang melibatkan, lengkap dengan output audio dan video. Dengan memanfaatkan model AI canggih dan teknik pemrosesan audio, ia mengotomatiskan seluruh alur kerja, membuatnya mudah untuk membuat konten podcast berkualitas tinggi dari dokumen tekstual.
Lisensi
Mari kita mengobrol;)