Note à ouverture d'origine

Aperçu
Le script de créateur de podcast (Open Sourced NotebookLM) est conçu pour automatiser le processus de création d'un podcast à partir d'un document PDF. Il extrait du texte du PDF, génère un script de podcast détaillé à l'aide du modèle GPT-4 d'OpenAI, convertit le script en audio, puis combine l'audio avec des images des pages PDF pour créer une vidéo. La sortie finale comprend à la fois un fichier audio et un fichier vidéo avec audio synchronisé.
Exemples
Mistral 7b
Lama2
L'attention est tout ce dont vous avez besoin
Openseurs d'autorisation de fonctionnalités
- Extraction de texte PDF : extrait le contenu texte à partir d'un document PDF.
- Génération de scripts : utilise le modèle GPT-4 d'OpenAI pour générer un script de podcast détaillé basé sur le texte extrait.
- Conversion text-vocation : convertit le script généré en audio à l'aide des capacités de texte-parole d'OpenAI.
- Traitement audio : traite l'audio pour s'assurer qu'il répond aux spécifications souhaitées (par exemple, stéréo, fréquence d'échantillonnage).
- Création vidéo : convertit les pages PDF en images et les combine avec l'audio pour créer une vidéo.
- Configuration de l'environnement : charge les variables d'environnement à partir d'un fichier
.env pour la gestion de la clé API sécurisée.
Flux de travail
- Extraire le texte de PDF : le script commence par extraire du texte du fichier PDF fourni.
- Générer un script de podcast : le texte extrait est utilisé pour générer un script de podcast avec deux hôtes, Alice et John, qui engagent une conversation détaillée sur le contenu.
- Convertir le script en audio : le script est converti en audio, avec différentes voix affectées à Alice et John.
- Processus Audio : l'audio est traité pour s'assurer qu'il est dans le bon format et la qualité.
- Créer une vidéo : les images des pages PDF sont créées et combinées avec l'audio pour produire une vidéo.
- Enregistrer les sorties : les fichiers audio et vidéo finaux sont enregistrés sur les chemins de sortie spécifiés.
Comment utiliser un carnet de carnet d'origine ouverte
Pour exécuter le projet:
- Remplissez le fichier .env
- Pour utiliser le script, fournissez simplement le chemin d'accès au fichier PDF et exécutez le script. Le script gérera le reste, générera le script de podcast, le convertit en audio, le traitement de l'audio et la création de la vidéo.
if name == "main" :
pdf_path = "/path/to/your/pdf/document.pdf"
create_podcast_from_pdf ( pdf_path )
poetry run python podcast_creator/main.py
Dépendances
-
langchain -
pydantic -
openai -
pydub -
fitz (pyMupdf) -
numpy -
subprocess -
tqdm -
PIL (oreiller) -
textwrap -
dotenv
Assurez-vous que toutes les dépendances sont installées avant d'exécuter le script.
Conclusion
Le script Podcast Creator (Open Sourced NotebookLM) fournit une solution complète pour convertir les documents PDF en épisodes de podcast engageants, avec des sorties audio et vidéo. En tirant parti des modèles AI avancés et des techniques de traitement audio, il automatise l'ensemble du flux de travail, ce qui facilite la création de contenu de podcast de haute qualité à partir de documents textuels.
Licence
Soyons discuter;)