Eine Open -Source -API -Alternative zur Podcast -Funktion von NotebookLM: Umwandlung multimodaler Inhalte in faszinierende mehrsprachige Audio -Konversationen mit Genai
Papier | Python -Paket | Cli | Restapi | Web -App | Rückmeldung
Podcastfy ist ein Open-Source-Python-Paket, das multimodale Inhalte (Text, Bilder) in ansprechende, multisprachige Audio-Konversationen mit Genai verwandelt. Eingabinhalt enthält Websites, PDFs, Bilder, YouTube -Videos sowie vom Benutzer bereitgestellte Themen.
Im Gegensatz zu UI-basierten Tools mit geschlossener Source konzentriert sich hauptsächlich auf die Forschungssynthese (z. B. NotebookLM ❤️), und konzentriert sich auf Open Source, programmatische und maßgeschneiderte Erzeugung von ansprechenden, gesprächigen Inhalten aus einer Vielzahl von Multimodalquellen und ermöglicht die Anpassung und Skalierung.
Diese Beispielsammlung wurde unter Verwendung dieses Python -Notizbuchs erzeugt.
Probe 1: Senecio, 1922 (Paul Klee) und Verbindung von Zivilisationen (2017) von Gheorghe Virtosu


Probe 2: Die große Welle von Kanagawa, 1831 (Hokusai) und Takiyasha The Hexe und The Skeleton Spectre, c. 1844 (Kuniyoshi)


Probe 3: Popkultur -Ikone Taylor Swift und Mona Lisa, 1503 (Leonardo da Vinci)


| Audio | Beschreibung | Quelle |
|---|---|---|
Souza.mp4 | Persönliche Website | Webseite |
Audio ( longform=True ) | Lex Fridman Podcast: 5H -Interview mit Dario Amodei Anthropics CEO | YouTube |
Audio ( longform=True ) | Benjamin Franklins Autobiographie | Buch |
| Sprache | Inhaltstyp | Beschreibung | Audio | Quelle |
|---|---|---|---|---|
| Französisch | Webseite | Agroklimatforschungsinformationen | Audio | Webseite |
| Portugiesisch-Br | Nachrichtenartikel | Wahlumfragen in São Paulo | Audio | Webseite |
$ pip install ffmpeg (für die Audioverarbeitung) Installieren Sie von PYPI $ pip install podcastfy
Richten Sie Ihre API -Schlüssel ein
from podcastfy . client import generate_podcast
audio_file = generate_podcast ( urls = [ "<url1>" , "<url2>" ]) python -m podcastfy.client --url <url1> --url <url2>
Python Package QuickStart
Wie zu
Python -Paketreferenzhandbuch
REST -API -Referenzhandbuch
Cli
Podcastfy bietet eine Reihe von Anpassungsoptionen, um Ihre Podcasts mit AI-generierten Podcasts anzupassen:
"Diese Initiative zu lieben und die Beste, die ich bisher gesehen habe, besonders für einen Non-Techie-Benutzer."
"Liebe, dass Sie beiläufig eine Open -Source -Version des beliebtesten Produkts, das Google im letzten Jahrzehnt integriert hat, beiläufig erstellt haben."
"Ihre Bibliothek war sehr einfach zu arbeiten. Sie haben erstaunliche Arbeit gemacht, Bruder"
"Ich finde es großartig, dass Sie inspiriert waren/erkennen, wie schwer es ist, NotebookLM-Qualität zu schlagen, aber Sie haben einen unglaublichen Job gemacht! Es klingt unglaublich und es ist Open-Source! Danke, dass Sie unglaublich sind!"
Weitere Informationen finden Sie unter ChangeLog.
Diese Software ist unter Apache 2.0 lizenziert. Sehen Sie sich Anweisungen an, wenn Sie Podcastfy in Ihrer Software verwenden möchten.
Wir begrüßen Beiträge! Weitere Informationen finden Sie unter Richtlinien.
Content Creators können Podcastfy verwenden, um Blog-Beiträge, Artikel oder Multimedia-Inhalte in Audio im Podcast-Stil zu konvertieren, sodass sie ein breiteres Publikum erreichen können. Durch die Umwandlung von Inhalten in ein Audio -Format können Ersteller für Benutzer gerecht werden, die es vorziehen, über das Lesen zuzuhören.
Pädagogen können Vorlesungsnotizen, Präsentationen und visuelle Materialien in Audiogespräche verwandeln, wodurch Bildungsinhalte für Schüler mit unterschiedlichen Lerneinstellungen zugänglicher werden. Dies ist besonders vorteilhaft für Schüler mit Sehbehinderungen oder solchen, die Schwierigkeiten haben, schriftliche Informationen zu verarbeiten.
Forscher können Forschungsarbeiten, visuelle Daten und technische Inhalte in Konversations -Audio umwandeln. Dies erleichtert ein breiteres Publikum, einschließlich derjenigen mit Behinderungen, um komplexe wissenschaftliche Informationen zu konsumieren und zu verstehen. Forscher können auch Audiozusammenfassungen ihrer Arbeit erstellen, um die Zugänglichkeit zu verbessern.
Befürworter der Barrierefreiheit können Podcastfy verwenden, um die digitale Zugänglichkeit zu fördern, indem ein Tool bereitgestellt wird, das multimodale Inhalte in auditorische Formate umwandelt. Dies hilft Personen mit Sehbehinderungen, Legasthenie oder anderen Behinderungen, die es schwierig machen, schriftliche oder visuelle Inhalte zu konsumieren.
↑ zurück nach oben ↑