open sourced nootbookLM Download - open sourced nootbookLM Source Code Download

open sourced nootbookLM

Anderer Quellcode

1.0.0

Herunterladen

Open Source NotebookLM

Podcast -Schöpfer

Überblick

Das Podcast Creators -Skript (Open Source NotebookLM) wurde entwickelt, um den Prozess des Erstellens eines Podcasts aus einem PDF -Dokument zu automatisieren. Es extrahiert Text aus dem PDF, erzeugt ein detailliertes Podcast-Skript mit OpenAIs GPT-4-Modell, konvertiert das Skript in Audio und kombiniert dann das Audio mit Bildern der PDF-Seiten, um ein Video zu erstellen. Die endgültige Ausgabe enthält sowohl eine Audiodatei als auch eine Videodatei mit synchronisiertem Audio.

Beispiele

Mistral 7b

LAMA22

Aufmerksamkeit ist alles was Sie brauchen

Open -Source NotebookLM -Funktionen

PDF -Textextraktion : Extrahiert Textinhalte aus einem PDF -Dokument.
Skriptgenerierung : Verwendet das GPT-4-Modell von OpenAI, um ein detailliertes Podcast-Skript basierend auf dem extrahierten Text zu generieren.
Text-to-Speech-Konvertierung : Umwandle das generierte Skript mithilfe von OpenAIs Text-to-Speech-Funktionen in Audio.
Audioverarbeitung : Verarbeitet das Audio, um sicherzustellen, dass die gewünschten Spezifikationen (z. B. Stereo, Stichprobenrate) erfüllt.
Videoerstellung : Konvertiert PDF -Seiten in Bilder und kombiniert sie mit dem Audio, um ein Video zu erstellen.
Umgebungskonfiguration : Lädt Umgebungsvariablen aus einer .env -Datei für die sichere Verwaltung von API -Schlüssel.

Workflow

Text aus PDF extrahieren : Das Skript startet mit dem Extrahieren von Text aus der bereitgestellten PDF -Datei.
Podcast -Skript generieren : Der extrahierte Text wird verwendet, um ein Podcast -Skript mit zwei Hosts zu generieren, Alice und John, die sich mit einer detaillierten Konversation über den Inhalt unterhalten.
Skript in Audio konvertieren : Das Skript wird in Audio konvertiert, wobei verschiedene Stimmen Alice und John zugewiesen sind.
Prozess Audio : Das Audio wird verarbeitet, um sicherzustellen, dass es sich in der richtigen Form und Qualität befindet.
Video erstellen : Bilder der PDF -Seiten werden erstellt und mit dem Audio kombiniert, um ein Video zu erstellen.
Ausgänge speichern : Die endgültigen Audio- und Videodateien werden in den angegebenen Ausgabempfaden gespeichert.

So verwenden Sie Open Sourced NotebookLM

Um das Projekt auszuführen:

   pip install poetry

   poetry install

füllen .Env -Datei

  OPENAI_API_KEY= " "

 cd podcast_creator

Um das Skript zu verwenden, geben Sie einfach den Pfad zur PDF -Datei an und führen Sie das Skript aus. Das Skript wird den Rest behandelt, das Podcast -Skript generiert, es in Audio konvertiert, das Audio verarbeitet und das Video erstellt.

 if name == "main" :
pdf_path = "/path/to/your/pdf/document.pdf"
create_podcast_from_pdf ( pdf_path )

   poetry run python podcast_creator/main.py

Abhängigkeiten

langchain
pydantic
openai
pydub
fitz (pymupdf)
numpy
subprocess
tqdm
PIL (Kissen)
textwrap
dotenv

Stellen Sie sicher, dass alle Abhängigkeiten vor dem Ausführen des Skripts installiert werden.

Abschluss

Das Skript von Podcast Creator (Open Sourced NotebookLM) bietet eine umfassende Lösung für die Konvertierung von PDF -Dokumenten in Podcast -Episoden mit Audio- und Videoausgängen. Durch die Nutzung fortschrittlicher KI-Modelle und Audioverarbeitungstechniken automatisiert der gesamte Workflow und erleichtert es, hochwertige Podcast-Inhalte aus Textdokumenten zu erstellen.