podcastfy Download - podcastfy Source Code Download

podcastfy

Autre code source

v0.4.0

Télécharger

Podcastfy.ai? ️?

Une alternative à l'API open source à la fonction de podcast de Notebooklm: transformer le contenu multimodal en conversations audio multilingues captivantes avec Genai

podcastfy.mp4

PodcastFy est un package Python open source qui transforme le contenu multimodal (texte, images) en conversations audio multilingues engageantes utilisant Genai. Le contenu d'entrée comprend des sites Web, des PDF, des images, des vidéos YouTube, ainsi que des sujets fournis par l'utilisateur.

Contrairement aux outils basés sur l'interface utilisateur à source fermée axés principalement sur la synthèse de la recherche (par exemple, Notebooklm ❤️), PodcastFy se concentre sur la génération open source, programmatique et sur mesure de contenu conversationnel engageant à partir d'une multitude de sources multimodales, d'activation de la personnalisation et de l'échelle.

Exemples audio?

Cette collection d'échantillons a été générée à l'aide de ce ordinateur portable Python.

Images

Échantillon 1: Senecio, 1922 (Paul Klee) et Connexion des civilisations (2017) par Gheorghe Virtosu

Senecio, 1922 (Paul Klee) Connexion des civilisations (2017) par Gheorghe Virtosu

Senecio.mp4

Échantillon 2: La grande vague au large de Kanagawa, 1831 (Hokusai) et Takiyasha la sorcière et le squelette Spectre, c. 1844 (Kuniyoshi)

La grande vague au large de Kanagawa, 1831 (Hokusai) Takiyasha la sorcière et le squelette Spectre, v. 1844 (Kuniyoshi)

japon.mp4

Échantillon 3: Icône de la culture pop Taylor Swift et Mona Lisa, 1503 (Leonardo da Vinci)

Taylor Swift Mona Lisa

taylor.mp4

Texte

Audio	Description	Source
souza.mp4	Site Web personnel	Site web
Audio ( `longform=True` )	Podcast Lex Fridman: interview 5H avec le PDG de Dario Amodei Anthropic	Youtube
Audio ( `longform=True` )	L'autobiographie de Benjamin Franklin	Livre

Texte multilingue

Langue	Type de contenu	Description	Audio	Source
Français	Site web	Informations sur la recherche agroclimat	Audio	Site web
Portugais-Br	Article de presse	Sondages électoraux à São Paulo	Audio	Site web

Start

Condition préalable

Python 3.11 ou plus
$ pip install ffmpeg (pour le traitement audio)

Installation

Installer à partir de PyPi $ pip install podcastfy
Configurez vos touches API

Python

 from podcastfy . client import generate_podcast

audio_file = generate_podcast ( urls = [ "<url1>" , "<url2>" ])

CLI

 python -m podcastfy.client --url <url1> --url <url2>

Usage

Package python quickstart
Comment
Manuel de référence du package Python
Manuel de référence de l'API REST
CLI

Personnalisation?

PodcastFy propose une gamme d'options de personnalisation pour adapter vos podcasts générés par l'IA:

Personnaliser la conversation du podcast (par exemple, format, style, voix)
Choisissez d'exécuter des LLM locaux (156+ modèles HuggingFace)
Définir d'autres paramètres de configuration

Caractéristiques

Générez du contenu conversationnel à partir de plusieurs sources et formats (images, texte, sites Web, YouTube et PDF).
Générez des podcasts de shorts (2 à 5 minutes) ou de forme longue (30+ minutes).
Personnalisez la transcription et la génération audio (par exemple, style, langue, structure).
Générez des transcriptions à l'aide de modèles LLM 100+ (OpenAI, anthropique, Google, etc.).
Tirez parti des LLM locaux pour la génération de transcrits pour une confidentialité et un contrôle accrus.
Intégrez aux modèles avancés de texte vocale (Openai, Google, ElevenLabs et Microsoft Edge).
Fournir un support multi-langues pour la création de contenu global.
Intégrez parfaitement avec les packages CLI et Python pour les workflows automatisés.

Témoignages

"Aimer cette initiative et le meilleur que j'ai vu jusqu'à présent surtout pour un utilisateur" non-Techie "."

"J'adore que vous ayez construit avec désinvolture une version open source du produit le plus populaire que Google a construit au cours de la dernière décennie"

"Votre bibliothèque était très simple pour travailler avec. Vous avez fait un travail incroyable frère"

"Je pense que c'est génial que vous ayez été inspiré / reconnue à quel point il est difficile de battre la qualité de Notebooklm, mais vous avez fait un travail incroyable avec ça! Cela semble incroyable, et c'est open-source! Merci d'être incroyable!"

Construit avec PodcastFy

OpenNotebook
SurfSense
Openpod
Podcast-llm
Application podcastfy-huggingface

Mises à jour

V0.4.0 +

Sortie du nouveau modèle TTS multi-haut-parleurs (est-ce le seul ordinateur portable que vous utilise?!?)
Générer des podcasts courts ou longs
Générer des podcasts à partir de la rubrique d'entrée à l'aide de la recherche Web en temps réel fondé
Intégrer avec plus de 100 modèles LLM (Openai, anthropic, Google, etc.) pour la génération de transcrits

Voir Changelog pour plus de détails.

Licence

Ce logiciel est sous licence sous Apache 2.0. Voir les instructions si vous souhaitez utiliser PodcastFy dans votre logiciel.

Contribuant?

Nous accueillons les contributions! Voir les directives pour plus de détails.

Exemple de cas d'utilisation?

Les créateurs de contenu peuvent utiliser Podcastfy pour convertir des articles de blog, des articles ou du contenu multimédia en audio de style podcast, leur permettant d'atteindre un public plus large. En transformant le contenu en format audio, les créateurs peuvent répondre aux utilisateurs qui préfèrent écouter à la lecture.
Les éducateurs peuvent transformer des notes de cours, des présentations et des documents visuels en conversations audio, ce qui rend le contenu éducatif plus accessible aux étudiants ayant des préférences d'apprentissage différentes. Ceci est particulièrement bénéfique pour les étudiants ayant des déficiences visuelles ou ceux qui ont du mal à traiter les informations écrites.
Les chercheurs peuvent convertir des articles de recherche, des données visuelles et du contenu technique en audio conversationnel. Cela permet à un public plus large, y compris ceux qui handicapés, de consommer et de comprendre des informations scientifiques complexes. Les chercheurs peuvent également créer des résumés audio de leur travail pour améliorer l'accessibilité.
Les défenseurs de l'accessibilité peuvent utiliser Podcastfy pour promouvoir l'accessibilité numérique en fournissant un outil qui convertit le contenu multimodal en formats auditifs. Cela aide les individus souffrant de troubles visuels, de dyslexie ou d'autres handicaps qui rendent difficile la consommation de contenu écrit ou visuel.

Contributeurs

↑ Retour en haut ↑

Développer

Informations supplémentaires

Version v0.4.0
Type Autre code source
Date de mise à jour 2025-02-28
taille 135MB
Provenant de Github

Applications connexes

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0

Actualités connexes Tout