podcastfy podcastfy

podcastfy

Outro código-fonte

v0.4.0

Baixar

Podcastfy.ai? ️?

Uma alternativa da API de código aberto ao recurso de podcast do Notebooklm: transformando conteúdo multimodal em conversas de áudio multilíngues cativantes com genai

Podcastfy.mp4

O Podcastfy é um pacote Python de código aberto que transforma o conteúdo multimodal (texto, imagens) em conversas de áudio multilíngues envolventes usando o Genai. O conteúdo de entrada inclui sites, PDFs, imagens, vídeos do YouTube e tópicos fornecidos pelo usuário.

Ao contrário das ferramentas baseadas em UI de código fechado focadas principalmente na síntese de pesquisa (por exemplo, notebooklm ❤️), o Podcastfy se concentra em geração de código aberto, programática e sob medida de envolvimento e de conversação de uma infinidade de fontes multimodais, permitindo a personalização e escala.

Exemplos de áudio?

Esta coleção de amostras foi gerada usando este notebook Python.

Imagens

Amostra 1: Senecio, 1922 (Paul Klee) e conexão de civilizações (2017) por Gheorghe Virtosu

Senecio, 1922 (Paul Klee) Conexão de civilizações (2017) por Gheorghe Virtosu

Senecio.mp4

Amostra 2: A Grande Onda de Kanagawa, 1831 (Hokusai) e Takiyasha, a bruxa e o espectro esqueleto, c. 1844 (Kuniyoshi)

The Great Wave Off Kanagawa, 1831 (Hokusai) Takiyasha A bruxa e o espectro esqueleto, c. 1844 (Kuniyoshi)

Japão.MP4

Amostra 3: Ícone da cultura pop Taylor Swift e Mona Lisa, 1503 (Leonardo da Vinci)

Taylor Swift Mona Lisa

Taylor.MP4

Texto

Áudio	Descrição	Fonte
Souza.mp4	Site pessoal	Site
Áudio ( `longform=True` )	Podcast Lex Fridman: entrevista 5H com CEO do Dario Amodeei Anthrópica	YouTube
Áudio ( `longform=True` )	Autobiografia de Benjamin Franklin	Livro

Texto multilingual

Linguagem	Tipo de conteúdo	Descrição	Áudio	Fonte
Francês	Site	Informações de pesquisa agroclima	Áudio	Site
Português-BR	Artigo de notícias	Pesquisas eleitorais em São Paulo	Áudio	Site

Investir rápido

Pré -requisitos

Python 3.11 ou superior
$ pip install ffmpeg (para processamento de áudio)

Configurar

Instale do $ pip install podcastfy
Configure suas chaves da API

Python

 from podcastfy . client import generate_podcast

audio_file = generate_podcast ( urls = [ "<url1>" , "<url2>" ])

CLI

 python -m podcastfy.client --url <url1> --url <url2>

Uso

Pacote Python Investir rápido
Como fazer
Manual de referência do pacote Python
Manual de referência da API REST
CLI

Personalização?

O Podcastfy oferece uma variedade de opções de personalização para adaptar seus podcasts gerados pela IA:

Personalize conversas de podcast (por exemplo, formato, estilo, vozes)
Escolha executar LLMs locais (mais de 156 modelos HuggingFace)
Defina outras definições de configuração

Características

Gere conteúdo de conversação de várias fontes e formatos (imagens, texto, sites, YouTube e PDFs).
Gere shorts (2-5 minutos) ou podcasts de desempenho longo (mais de 30 minutos).
Personalize a geração de transcrição e áudio (por exemplo, estilo, idioma, estrutura).
Gere transcrições usando 100+ modelos LLM (OpenAI, Antrópico, Google etc).
Aproveite os LLMs locais para geração de transcrição para maior privacidade e controle.
Integre-se aos modelos avançados de texto em fala (OpenAI, Google, Elevenlabs e Microsoft Edge).
Forneça suporte multi-idioma para a criação de conteúdo global.
Integrar -se perfeitamente aos pacotes CLI e Python para fluxos de trabalho automatizados.

Depoimentos

"Amar esta iniciativa e o melhor que já vi até agora, especialmente para um usuário 'não-técnico'".

"Adoro que você construiu casualmente uma versão de código aberto do produto mais popular que o Google construído na última década"

"Sua biblioteca era muito direta para trabalhar. Você fez um irmão de trabalho incrível"

"Eu acho incrível que você tenha sido inspirado/reconheça o quão difícil é vencer a qualidade do Notebooklm, mas você fez um trabalho incrível com isso! Parece incrível e é de código aberto! Obrigado por ser incrível!"

Construído com podcastfy

OpenNoteBook
SurfSense
OpenPod
Podcast-llm
App de podcastfy-huggingface

Atualizações

v0.4.0+ Release

Liberou o novo modelo TTS multi-falante (é o único notebooklm usa?!?)
Gerar podcasts curtos ou longos
Gere podcasts a partir do tópico de entrada usando pesquisa na web em tempo real fundamentada
Integrar -se com os modelos 100+ LLM (OpenAI, Anthropic, Google etc) para geração de transcrição

Veja Changelog para obter mais detalhes.

Licença

Este software está licenciado no Apache 2.0. Consulte as instruções se quiser usar o Podcastfy em seu software.

Contribuindo?

Congratulamo -nos com contribuições! Consulte as diretrizes para obter mais detalhes.

Exemplo de uso de casos?

Os criadores de conteúdo podem usar Podcastfy para converter postagens, artigos ou conteúdo multimídia em áudio no estilo de podcast, permitindo que eles atinjam o público mais amplo. Ao transformar o conteúdo em um formato de áudio, os criadores podem atender aos usuários que preferem ouvir a leitura.
Os educadores podem transformar notas de palestras, apresentações e materiais visuais em conversas de áudio, tornando o conteúdo educacional mais acessível aos alunos com diferentes preferências de aprendizado. Isso é particularmente benéfico para estudantes com deficiência visual ou aqueles que têm dificuldade em processar informações escritas.
Os pesquisadores podem converter trabalhos de pesquisa, dados visuais e conteúdo técnico em áudio de conversação. Isso facilita para um público mais amplo, incluindo aqueles com deficiência, consumir e entender informações científicas complexas. Os pesquisadores também podem criar resumos de áudio de seu trabalho para aumentar a acessibilidade.
Os advogados de acessibilidade podem usar Podcastfy para promover a acessibilidade digital, fornecendo uma ferramenta que converte conteúdo multimodal em formatos auditivos. Isso ajuda indivíduos com deficiências visuais, dislexia ou outras deficiências que tornam desafiador consumir conteúdo escrito ou visual.

Colaboradores

↑ Voltar ao topo ↑

Expandir

Informações adicionais

Versão v0.4.0
Tipo Outro código-fonte
Data da Última Atualização 2025-02-28
tamanho 135MB
Vindo de Github

Aplicativos Relacionados

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Outro código-fonte

1.0.0

Informações Relacionadas Todos