Notebooklm de origen abierto

Descripción general
El script de Podcast Creator (Open ORGECE NOTOBOBookLM) está diseñado para automatizar el proceso de creación de un podcast desde un documento PDF. Extrae texto del PDF, genera un script de podcast detallado utilizando el modelo GPT-4 de OpenAI, convierte el script en audio y luego combina el audio con imágenes de las páginas PDF para crear un video. La salida final incluye tanto un archivo de audio como un archivo de video con audio sincronizado.
Ejemplos
Mistral 7b
Llama2
La atención es todo lo que necesitas
Características abiertas de cuaderno de origen
- Extracción de texto en PDF : extrae contenido de texto de un documento PDF.
- Generación de scripts : utiliza el modelo GPT-4 de OpenAI para generar un script de podcast detallado basado en el texto extraído.
- Conversión de texto a voz : Convierte el script generado en audio utilizando las capacidades de texto a voz de OpenAI.
- Procesamiento de audio : procesa el audio para garantizar que cumpla con las especificaciones deseadas (por ejemplo, estéreo, frecuencia de muestreo).
- Creación de video : convierte las páginas PDF en imágenes y las combina con el audio para crear un video.
- Configuración del entorno : Carga las variables de entorno de un archivo
.env para la administración de claves API seguras.
Flujo de trabajo
- Extraiga texto de PDF : el script comienza extrayendo texto del archivo PDF proporcionado.
- Genere el script de podcast : el texto extraído se usa para generar un script de podcast con dos anfitriones, Alice y John, que participan en una conversación detallada sobre el contenido.
- Convertir el script a audio : el script se convierte en audio, con diferentes voces asignadas a Alice y John.
- Audio de proceso : el audio se procesa para garantizar que esté en el formato y la calidad correctos.
- Crear video : las imágenes de las páginas PDF se crean y combinan con el audio para producir un video.
- Guardar salidas : los archivos finales de audio y video se guardan en las rutas de salida especificadas.
Cómo usar el cuaderno de origen abierto
Para ejecutar el proyecto:
- llenar el archivo .env
- Para usar el script, simplemente proporcione la ruta al archivo PDF y ejecute el script. El script manejará el resto, generando el script de podcast, convertirlo en audio, procesar el audio y crear el video.
if name == "main" :
pdf_path = "/path/to/your/pdf/document.pdf"
create_podcast_from_pdf ( pdf_path )
poetry run python podcast_creator/main.py
Dependencias
-
langchain -
pydantic -
openai -
pydub -
fitz (Pymupdf) -
numpy -
subprocess -
tqdm -
PIL (almohada) -
textwrap -
dotenv
Asegúrese de que se instalen todas las dependencias antes de ejecutar el script.
Conclusión
El script Podcast Creator (Open Tourced NotebookLM) proporciona una solución integral para convertir documentos PDF en episodios de podcastes interesantes, completos con salidas de audio y video. Al aprovechar los modelos AI avanzados y las técnicas de procesamiento de audio, automatiza todo el flujo de trabajo, lo que facilita la creación de contenido de podcast de alta calidad a partir de documentos textuales.
Licencia
Vamos a charlar;)