Notebooklm de fonte aberta

Visão geral
O Script Creator de Podcast (Notebooklm de fonte aberta) foi projetada para automatizar o processo de criação de um podcast a partir de um documento PDF. Ele extrai o texto do PDF, gera um script de podcast detalhado usando o modelo GPT-4 do OpenAI, converte o script em áudio e combina o áudio com imagens das páginas PDF para criar um vídeo. A saída final inclui um arquivo de áudio e um arquivo de vídeo com áudio sincronizado.
Exemplos
Mistral 7b
Llama2
Atenção é tudo que você precisa
Recursos de notebooklm de origem aberta
- Extração de texto em PDF : extrai o conteúdo de texto de um documento PDF.
- Geração de script : usa o modelo GPT-4 do OpenAI para gerar um script de podcast detalhado com base no texto extraído.
- Conversão de texto em fala : converte o script gerado em áudio usando os recursos de texto em fala do OpenAI.
- Processamento de áudio : processa o áudio para garantir que atenda às especificações desejadas (por exemplo, estéreo, taxa de amostragem).
- Criação de vídeo : converte páginas em PDF em imagens e as combina com o áudio para criar um vídeo.
- Configuração do ambiente : carrega variáveis de ambiente de um arquivo
.env para gerenciamento de chaves da API segura.
Fluxo de trabalho
- Extraia o texto do PDF : o script inicia extraindo texto do arquivo PDF fornecido.
- Gerate Script de podcast : O texto extraído é usado para gerar um script de podcast com dois hosts, Alice e John, que se envolvem em uma conversa detalhada sobre o conteúdo.
- Converta o script em áudio : o script é convertido em áudio, com diferentes vozes atribuídas a Alice e John.
- Áudio de processo : o áudio é processado para garantir que esteja no formato e na qualidade corretos.
- Criar vídeo : as imagens das páginas em PDF são criadas e combinadas com o áudio para produzir um vídeo.
- Salvar saídas : os arquivos finais de áudio e vídeo são salvos nos caminhos de saída especificados.
Como usar notebook de origem aberta
Para executar o projeto:
- preencha o arquivo .env
- Para usar o script, basta fornecer o caminho para o arquivo PDF e executar o script. O script lidará com o restante, gerando o script de podcast, convertendo -o em áudio, processando o áudio e criando o vídeo.
if name == "main" :
pdf_path = "/path/to/your/pdf/document.pdf"
create_podcast_from_pdf ( pdf_path )
poetry run python podcast_creator/main.py
Dependências
-
langchain -
pydantic -
openai -
pydub -
fitz (pymupdf) -
numpy -
subprocess -
tqdm -
PIL (travesseiro) -
textwrap -
dotenv
Verifique se todas as dependências estão instaladas antes de executar o script.
Conclusão
O script de criador de podcast (notebooklm de origem aberta) fornece uma solução abrangente para converter documentos em PDF em episódios de podcast envolventes, completos com saídas de áudio e vídeo. Ao alavancar modelos avançados de IA e técnicas de processamento de áudio, ele automatiza todo o fluxo de trabalho, facilitando a criação de conteúdo de podcast de alta qualidade a partir de documentos textuais.
Licença
Vamos conversar;)