Open Source NotebookLM

Überblick
Das Podcast Creators -Skript (Open Source NotebookLM) wurde entwickelt, um den Prozess des Erstellens eines Podcasts aus einem PDF -Dokument zu automatisieren. Es extrahiert Text aus dem PDF, erzeugt ein detailliertes Podcast-Skript mit OpenAIs GPT-4-Modell, konvertiert das Skript in Audio und kombiniert dann das Audio mit Bildern der PDF-Seiten, um ein Video zu erstellen. Die endgültige Ausgabe enthält sowohl eine Audiodatei als auch eine Videodatei mit synchronisiertem Audio.
Beispiele
Mistral 7b
LAMA22
Aufmerksamkeit ist alles was Sie brauchen
Open -Source NotebookLM -Funktionen
- PDF -Textextraktion : Extrahiert Textinhalte aus einem PDF -Dokument.
- Skriptgenerierung : Verwendet das GPT-4-Modell von OpenAI, um ein detailliertes Podcast-Skript basierend auf dem extrahierten Text zu generieren.
- Text-to-Speech-Konvertierung : Umwandle das generierte Skript mithilfe von OpenAIs Text-to-Speech-Funktionen in Audio.
- Audioverarbeitung : Verarbeitet das Audio, um sicherzustellen, dass die gewünschten Spezifikationen (z. B. Stereo, Stichprobenrate) erfüllt.
- Videoerstellung : Konvertiert PDF -Seiten in Bilder und kombiniert sie mit dem Audio, um ein Video zu erstellen.
- Umgebungskonfiguration : Lädt Umgebungsvariablen aus einer
.env -Datei für die sichere Verwaltung von API -Schlüssel.
Workflow
- Text aus PDF extrahieren : Das Skript startet mit dem Extrahieren von Text aus der bereitgestellten PDF -Datei.
- Podcast -Skript generieren : Der extrahierte Text wird verwendet, um ein Podcast -Skript mit zwei Hosts zu generieren, Alice und John, die sich mit einer detaillierten Konversation über den Inhalt unterhalten.
- Skript in Audio konvertieren : Das Skript wird in Audio konvertiert, wobei verschiedene Stimmen Alice und John zugewiesen sind.
- Prozess Audio : Das Audio wird verarbeitet, um sicherzustellen, dass es sich in der richtigen Form und Qualität befindet.
- Video erstellen : Bilder der PDF -Seiten werden erstellt und mit dem Audio kombiniert, um ein Video zu erstellen.
- Ausgänge speichern : Die endgültigen Audio- und Videodateien werden in den angegebenen Ausgabempfaden gespeichert.
So verwenden Sie Open Sourced NotebookLM
Um das Projekt auszuführen:
- füllen .Env -Datei
- Um das Skript zu verwenden, geben Sie einfach den Pfad zur PDF -Datei an und führen Sie das Skript aus. Das Skript wird den Rest behandelt, das Podcast -Skript generiert, es in Audio konvertiert, das Audio verarbeitet und das Video erstellt.
if name == "main" :
pdf_path = "/path/to/your/pdf/document.pdf"
create_podcast_from_pdf ( pdf_path )
poetry run python podcast_creator/main.py
Abhängigkeiten
-
langchain -
pydantic -
openai -
pydub -
fitz (pymupdf) -
numpy -
subprocess -
tqdm -
PIL (Kissen) -
textwrap -
dotenv
Stellen Sie sicher, dass alle Abhängigkeiten vor dem Ausführen des Skripts installiert werden.
Abschluss
Das Skript von Podcast Creator (Open Sourced NotebookLM) bietet eine umfassende Lösung für die Konvertierung von PDF -Dokumenten in Podcast -Episoden mit Audio- und Videoausgängen. Durch die Nutzung fortschrittlicher KI-Modelle und Audioverarbeitungstechniken automatisiert der gesamte Workflow und erleichtert es, hochwertige Podcast-Inhalte aus Textdokumenten zu erstellen.
Lizenz
Lass uns einen Chat machen;)