Una alternativa de API de código abierto a la función de podcast de Notebooklm: transformar contenido multimodal en cautivadoras conversaciones de audio multilingües con Genai
Papel | Paquete de Python | CLI | REST API | Aplicación web | Comentario
Podcastfy es un paquete Python de código abierto que transforma el contenido multimodal (texto, imágenes) en conversaciones de audio multilingües y atractivas utilizando Genai. El contenido de entrada incluye sitios web, PDF, imágenes, videos de YouTube, así como temas proporcionados por el usuario.
A diferencia de las herramientas basadas en la UI de código cerrado centrados principalmente en la síntesis de investigación (p. Ej., NotebookLM ❤️), Podcastfy se enfoca en la generación de código abierto, programática y a medida de contenido conversacional atractivo de una multitud de fuentes multimodales, permitiendo la personalización y escala.
Esta colección de muestras se generó utilizando este cuaderno de Python.
Muestra 1: Senecio, 1922 (Paul Klee) y Connection of Civilizations (2017) por Gheorghe Virtosu


Muestra 2: The Great Wave Off Kanagawa, 1831 (Hokusai) y Takiyasha the Witch and the Skeleton Spectre, c. 1844 (Kuniyoshi)


Muestra 3: Icono de cultura pop Taylor Swift y Mona Lisa, 1503 (Leonardo da Vinci)


| Audio | Descripción | Fuente |
|---|---|---|
souza.mp4 | Sitio web personal | Sitio web |
Audio ( longform=True ) | Podcast de Lex Fridman: entrevista 5h con el CEO de Dario Amodei Anthrope | YouTube |
Audio ( longform=True ) | Autobiografía de Benjamin Franklin | Libro |
| Idioma | Tipo de contenido | Descripción | Audio | Fuente |
|---|---|---|---|---|
| Francés | Sitio web | Información de investigación de acroclimas | Audio | Sitio web |
| Portugués-Br | Artículo | Encuestas electorales en São Paulo | Audio | Sitio web |
$ pip install ffmpeg (para procesamiento de audio) Instalar desde Pypi $ pip install podcastfy
Configura tus teclas API
from podcastfy . client import generate_podcast
audio_file = generate_podcast ( urls = [ "<url1>" , "<url2>" ]) python -m podcastfy.client --url <url1> --url <url2>
Paquete python rápido
Como
Manual de referencia del paquete de Python
Manual de referencia de REST API
CLI
Podcastfy ofrece una gama de opciones de personalización para adaptar sus podcasts generados por IA:
"Me encanta esta iniciativa y lo mejor que he visto hasta ahora, especialmente para un usuario 'no técnico'".
"Me encanta que haya construido casualmente una versión de código abierto del producto más popular Google construido en la última década"
"Fue muy sencillo trabajar con su biblioteca. Hiciste un trabajo increíble hermano"
"Creo que es increíble que estés inspirado/reconozca lo difícil que es vencer la calidad de Notebooklm, ¡pero hiciste un trabajo increíble con esto! Suena increíble, ¡y es de código abierto! ¡Gracias por ser increíble!"
Vea ChangeLog para más detalles.
Este software tiene licencia bajo Apache 2.0. Consulte las instrucciones si desea usar Podcastfy en su software.
¡Agradecemos las contribuciones! Consulte las pautas para obtener más detalles.
Los creadores de contenido pueden usar Podcastfy para convertir publicaciones de blog, artículos o contenido multimedia en audio al estilo de podcast, lo que les permite llegar al público más amplio. Al transformar el contenido en un formato de audio, los creadores pueden atender a los usuarios que prefieren escuchar sobre la lectura.
Los educadores pueden transformar las notas de conferencias, las presentaciones y los materiales visuales en conversaciones de audio, haciendo que el contenido educativo sea más accesible para los estudiantes con diferentes preferencias de aprendizaje. Esto es particularmente beneficioso para los estudiantes con discapacidades visuales o para aquellos que tienen dificultades para procesar información escrita.
Los investigadores pueden convertir trabajos de investigación, datos visuales y contenido técnico en audio conversacional. Esto hace que sea más fácil para un público más amplio, incluidos aquellos con discapacidades, consumir y comprender información científica compleja. Los investigadores también pueden crear resúmenes de audio de su trabajo para mejorar la accesibilidad.
Los defensores de la accesibilidad pueden usar Podcastfy para promover la accesibilidad digital al proporcionar una herramienta que convierta el contenido multimodal en formatos auditivos. Esto ayuda a las personas con discapacidades visuales, dislexia u otras discapacidades que hacen que sea difícil consumir contenido escrito o visual.
↑ volver a la cima ↑