Une alternative à l'API open source à la fonction de podcast de Notebooklm: transformer le contenu multimodal en conversations audio multilingues captivantes avec Genai
Papier | Package Python | CLI | API REST | Application Web | Retour
PodcastFy est un package Python open source qui transforme le contenu multimodal (texte, images) en conversations audio multilingues engageantes utilisant Genai. Le contenu d'entrée comprend des sites Web, des PDF, des images, des vidéos YouTube, ainsi que des sujets fournis par l'utilisateur.
Contrairement aux outils basés sur l'interface utilisateur à source fermée axés principalement sur la synthèse de la recherche (par exemple, Notebooklm ❤️), PodcastFy se concentre sur la génération open source, programmatique et sur mesure de contenu conversationnel engageant à partir d'une multitude de sources multimodales, d'activation de la personnalisation et de l'échelle.
Cette collection d'échantillons a été générée à l'aide de ce ordinateur portable Python.
Échantillon 1: Senecio, 1922 (Paul Klee) et Connexion des civilisations (2017) par Gheorghe Virtosu


Échantillon 2: La grande vague au large de Kanagawa, 1831 (Hokusai) et Takiyasha la sorcière et le squelette Spectre, c. 1844 (Kuniyoshi)


Échantillon 3: Icône de la culture pop Taylor Swift et Mona Lisa, 1503 (Leonardo da Vinci)


| Audio | Description | Source |
|---|---|---|
souza.mp4 | Site Web personnel | Site web |
Audio ( longform=True ) | Podcast Lex Fridman: interview 5H avec le PDG de Dario Amodei Anthropic | Youtube |
Audio ( longform=True ) | L'autobiographie de Benjamin Franklin | Livre |
| Langue | Type de contenu | Description | Audio | Source |
|---|---|---|---|---|
| Français | Site web | Informations sur la recherche agroclimat | Audio | Site web |
| Portugais-Br | Article de presse | Sondages électoraux à São Paulo | Audio | Site web |
$ pip install ffmpeg (pour le traitement audio) Installer à partir de PyPi $ pip install podcastfy
Configurez vos touches API
from podcastfy . client import generate_podcast
audio_file = generate_podcast ( urls = [ "<url1>" , "<url2>" ]) python -m podcastfy.client --url <url1> --url <url2>
Package python quickstart
Comment
Manuel de référence du package Python
Manuel de référence de l'API REST
CLI
PodcastFy propose une gamme d'options de personnalisation pour adapter vos podcasts générés par l'IA:
"Aimer cette initiative et le meilleur que j'ai vu jusqu'à présent surtout pour un utilisateur" non-Techie "."
"J'adore que vous ayez construit avec désinvolture une version open source du produit le plus populaire que Google a construit au cours de la dernière décennie"
"Votre bibliothèque était très simple pour travailler avec. Vous avez fait un travail incroyable frère"
"Je pense que c'est génial que vous ayez été inspiré / reconnue à quel point il est difficile de battre la qualité de Notebooklm, mais vous avez fait un travail incroyable avec ça! Cela semble incroyable, et c'est open-source! Merci d'être incroyable!"
Voir Changelog pour plus de détails.
Ce logiciel est sous licence sous Apache 2.0. Voir les instructions si vous souhaitez utiliser PodcastFy dans votre logiciel.
Nous accueillons les contributions! Voir les directives pour plus de détails.
Les créateurs de contenu peuvent utiliser Podcastfy pour convertir des articles de blog, des articles ou du contenu multimédia en audio de style podcast, leur permettant d'atteindre un public plus large. En transformant le contenu en format audio, les créateurs peuvent répondre aux utilisateurs qui préfèrent écouter à la lecture.
Les éducateurs peuvent transformer des notes de cours, des présentations et des documents visuels en conversations audio, ce qui rend le contenu éducatif plus accessible aux étudiants ayant des préférences d'apprentissage différentes. Ceci est particulièrement bénéfique pour les étudiants ayant des déficiences visuelles ou ceux qui ont du mal à traiter les informations écrites.
Les chercheurs peuvent convertir des articles de recherche, des données visuelles et du contenu technique en audio conversationnel. Cela permet à un public plus large, y compris ceux qui handicapés, de consommer et de comprendre des informations scientifiques complexes. Les chercheurs peuvent également créer des résumés audio de leur travail pour améliorer l'accessibilité.
Les défenseurs de l'accessibilité peuvent utiliser Podcastfy pour promouvoir l'accessibilité numérique en fournissant un outil qui convertit le contenu multimodal en formats auditifs. Cela aide les individus souffrant de troubles visuels, de dyslexie ou d'autres handicaps qui rendent difficile la consommation de contenu écrit ou visuel.
↑ Retour en haut ↑