Alternatif API Sumber Terbuka untuk Fitur Podcast Notebooklm: Mengubah Konten Multimodal Menjadi Memikat Percakapan Audio Multilingual Dengan Genai
Kertas | Paket Python | CLI | REST API | Aplikasi Web | Masukan
Podcastfy adalah paket python open-source yang mengubah konten multi-modal (teks, gambar) menjadi percakapan audio multi-bahasa yang menarik menggunakan Genai. Konten input termasuk situs web, PDF, gambar, video YouTube, serta topik yang disediakan pengguna.
Tidak seperti alat berbasis UI sumber tertutup yang difokuskan terutama pada sintesis penelitian (misalnya notebooklm ❤️), PodcastFy berfokus pada open source, generasi terprogram dan dipesan lebih dahulu dari konten percakapan dari banyak sumber multi-modal, memungkinkan kustomisasi dan skala.
Koleksi sampel ini dihasilkan menggunakan notebook Python ini.
Contoh 1: Senecio, 1922 (Paul Klee) dan Koneksi Peradaban (2017) oleh Gheorghe Virtosu


Contoh 2: Gelombang Besar dari Kanagawa, 1831 (Hokusai) dan Takiyasha the Witch dan The Skeleton Spectre, c. 1844 (Kuniyoshi)


Contoh 3: Ikon Budaya Pop Taylor Swift dan Mona Lisa, 1503 (Leonardo da Vinci)


| Audio | Keterangan | Sumber |
|---|---|---|
souza.mp4 | Situs web pribadi | Situs web |
Audio ( longform=True ) | Lex Fridman Podcast: Wawancara 5H dengan CEO Dario Amodei Anthropic | YouTube |
Audio ( longform=True ) | Autobiografi Benjamin Franklin | Buku |
| Bahasa | Jenis konten | Keterangan | Audio | Sumber |
|---|---|---|---|---|
| Perancis | Situs web | Informasi Penelitian Agroklimasi | Audio | Situs web |
| Portugis-BR | Artikel berita | Pemilihan pemilihan di São Paulo | Audio | Situs web |
$ pip install ffmpeg (untuk pemrosesan audio) Instal dari PYPI $ pip install podcastfy
Siapkan Kunci API Anda
from podcastfy . client import generate_podcast
audio_file = generate_podcast ( urls = [ "<url1>" , "<url2>" ]) python -m podcastfy.client --url <url1> --url <url2>
Paket Python QuickStart
Bagaimana
Manual Referensi Paket Python
Manual Referensi API Istirahat
Cli
Podcastfy menawarkan berbagai opsi penyesuaian untuk menyesuaikan podcast yang dihasilkan AI Anda:
"Menyukai inisiatif ini dan yang terbaik yang pernah saya lihat sejauh ini terutama untuk pengguna 'non-teknik'."
"Cinta bahwa Anda dengan santai membangun versi open source dari produk paling populer yang dibangun Google dalam dekade terakhir"
"Perpustakaan Anda sangat mudah untuk diajak bekerja sama. Anda melakukan kerja yang luar biasa"
"Saya pikir luar biasa bahwa Anda terinspirasi/mengenali betapa sulitnya mengalahkan kualitas Notebooklm, tetapi Anda melakukan pekerjaan yang luar biasa dengan ini! Kedengarannya luar biasa, dan ini open-source! Terima kasih telah menjadi luar biasa!"
Lihat Changelog untuk detail lebih lanjut.
Perangkat lunak ini dilisensikan di bawah Apache 2.0. Lihat instruksi jika Anda ingin menggunakan PodcastFy di perangkat lunak Anda.
Kami menyambut kontribusi! Lihat Pedoman untuk detail lebih lanjut.
Pembuat konten dapat menggunakan Podcastfy untuk mengonversi posting blog, artikel, atau konten multimedia menjadi audio gaya podcast, memungkinkan mereka menjangkau audiens yang lebih luas. Dengan mengubah konten menjadi format audio, pembuat dapat melayani pengguna yang lebih suka mendengarkan daripada membaca.
Pendidik dapat mengubah catatan kuliah, presentasi, dan materi visual menjadi percakapan audio, membuat konten pendidikan lebih mudah diakses oleh siswa dengan preferensi pembelajaran yang berbeda. Ini sangat bermanfaat bagi siswa dengan gangguan penglihatan atau mereka yang mengalami kesulitan memproses informasi tertulis.
Para peneliti dapat mengonversi makalah penelitian, data visual, dan konten teknis menjadi audio percakapan. Ini membuatnya lebih mudah bagi khalayak yang lebih luas, termasuk mereka yang cacat, untuk mengkonsumsi dan memahami informasi ilmiah yang kompleks. Para peneliti juga dapat membuat ringkasan audio dari pekerjaan mereka untuk meningkatkan aksesibilitas.
Advokat aksesibilitas dapat menggunakan Podcastfy untuk mempromosikan aksesibilitas digital dengan menyediakan alat yang mengubah konten multimoda menjadi format pendengaran. Ini membantu individu dengan gangguan visual, disleksia, atau kecacatan lain yang membuatnya sulit untuk mengkonsumsi konten tertulis atau visual.
↑ Kembali ke atas ↑