Open Sourceed Notebooklm

Обзор
Сценарий создателя подкаста (Open Sourceed NoteBooklm) предназначен для автоматизации процесса создания подкаста из PDF -документа. Он извлекает текст из PDF, генерирует подробный скрипт подкаста с использованием модели Openai GPT-4, преобразует скрипт в аудио, а затем объединяет звук с изображениями PDF-страниц для создания видео. Окончательный вывод включает как аудиофайл, так и видеофайл с синхронизированным аудио.
Примеры
Мишстраль 7b
Лама2
Внимание - это все, что вам нужно
Особенности NoteBooklm с открытым источником
- Извлечение текста в формате PDF : извлекает текстовый содержимое из документа PDF.
- Генерация скриптов : использует модель GPT-4 OpenAI для создания подробного сценария подкаста на основе извлеченного текста.
- Преобразование текста в речь : преобразует сгенерированный скрипт в аудио с помощью возможностей Openai в речь.
- Обработка аудио : обрабатывает аудио, чтобы убедиться, что он соответствует желаемым спецификациям (например, стерео, скорость дискретизации).
- Создание видео : преобразует PDF -страницы в изображения и объединяет их с аудио для создания видео.
- Конфигурация среды : загружает переменные среды из файла
.env для безопасного управления ключами API.
Рабочий процесс
- Извлеките текст из PDF : скрипт начинается с извлечения текста из предоставленного файла PDF.
- Создать скрипт подкаста : извлеченный текст используется для создания сценария подкаста с участием двух хостов, Алисы и Джона, которые участвуют в подробном разговоре о контенте.
- Конвертировать скрипт в аудио : сценарий преобразуется в аудио, с различными голосами, назначенными Алисе и Джону.
- Процесс аудио : аудио обрабатывается, чтобы убедиться, что он находится в правильном формате и качеством.
- Создание видео : изображения страниц PDF создаются и объединяются с аудио для создания видео.
- Сохранить выходы : окончательные аудио и видеофайлы сохраняются в указанных выходных путях.
Как использовать открытые источники Notebooklm
Запустить проект:
- заполнить .ENV -файл
- Чтобы использовать скрипт, просто предоставьте путь к файлу PDF и запустите скрипт. Сценарий будет обрабатывать остальные, генерируя скрипт подкаста, преобразование его в аудио, обработку звука и создание видео.
if name == "main" :
pdf_path = "/path/to/your/pdf/document.pdf"
create_podcast_from_pdf ( pdf_path )
poetry run python podcast_creator/main.py
Зависимости
-
langchain -
pydantic -
openai -
pydub -
fitz (Pymupdf) -
numpy -
subprocess -
tqdm -
PIL (подушка) -
textwrap -
dotenv
Убедитесь, что все зависимости установлены перед запуском сценария.
Заключение
Скрипт создателя подкаста (открытый нот -книг) предоставляет всеобъемлющее решение для преобразования PDF -документов в привлечение эпизодов подкастов, в комплекте с аудио и видео выходами. Используя усовершенствованные модели ИИ и методы обработки аудио, он автоматизирует весь рабочий процесс, что позволяет легко создавать высококачественный контент подкастов из текстовых документов.
Лицензия
Давайте поговорим;)