скачать podgenai - загрузка исходного кода podgenai

podgenai

Другой исходный код

0.8.0

Скачать

Podgenai

Podgenai -это приложение Python 3.12 для генерации информационного файла MP3 с одним ди-ди-ди-ди-ди-ди-ди-позвоночником по данной теме с использованием GPT-4 LLM. Целевая продолжительность сгенерированного файла составляет час, хотя сгенерированная продолжительность варьируется. Требуется финансируемый ключ API OpenAI.

Ссылки

Подпись	Связь
Репо	https://github.com/impredicative/podgenai
Изменение	https://github.com/impredicative/podgenai/releases
Упаковка	https://pypi.org/project/podgenai
Подкаст	https://podcasters.spotify.com/pod/podgenai
Подкаст RSS	https://anchor.fm/s/f4868644/podcast/rss

Подход

Модели gpt-4o и tts-1 используются. Для данной темы, справочный подход высокого уровня:

Применимые подтемы перечислены с использованием LLM. Однако, если тема неизвестна LLM, процесс прерывается.
Голос выбирается с использованием LLM из четырех вариантов.
Одновременно для каждой подтопии соответствующая текст и речь генерируются с использованием LLM и TTS соответственно.
Речевые файлы объединяются с использованием ffmpeg .

Хотя иногда может существовать какое -то семантическое повторение контента по всему подтемам, это намеренно не было «оптимизировано», потому что это повторение важных моментов может помочь в обучении и запоминании. Чтобы глубже погрузиться в определенную подторику, можно попытаться создать новый файл только для него.

Образцы

Эти сгенерированные файлы MP3 доступны для скачивания. По сути, они также составляют минимальный набор ручных испытаний с уникальной целью каждого образца. В качестве напоминания, голос выбирается LLM.

Существует также связанный подкаст (RSS), на который эпизоды по дополнительным темам могут быть опубликованы вручную с течением времени.

Скорость воспроизведения 1,05x рекомендуется для нетехнических тем, 1,0x для технических тем и 0,95x для тематических тем по иностранным языкам.

Голос	Имя	Цель
По умолчанию	Пирог	Техническое поколение
По умолчанию	Advanced Pytorch	Расширенная генерация технического контента
По умолчанию	Советы по собеседованию инженера программного обеспечения	Выбор голоса по умолчанию
Эмоциональный	Нью -Йорк: настоящее и будущее	Нетехническое поколение содержания
Эмоциональный	Жить хорошей жизнью	Эмоциональный выбор голоса
По умолчанию	Искусственный общий интеллект (AGI): подходы и алгоритмы	Не иерархическое сглаженное одноуровневое подтопительное правоприменение
Женский	Система кровообращения человека (без применения)	Неявная тема
Женский	Баффи, вампирская убийца	Женский выбор голоса
Мужской	Биткойн для ботаников	Мужской выбор голоса

Настраивать

Общая настройка

В рабочем каталоге создайте файл с именем .env с предполагаемой переменной среды OPENAI_API_KEY=<your OpenAI API key> или установите его по -другому.
При желании также установите переменную среду PODGENAI_OPENAI_MAX_WORKERS=32 для более быстрого поколения, при этом значение по умолчанию составляет 16.
Убедитесь, что ffmpeg доступен. Это автоматически при использовании включенного определения DevContainer.
Продолжайте настройку через GitHub или PYPI, как показано ниже.

Настройка через GitHub с помощью DevContainer

Продолжить с общих шагов настройки.
Клонировать или скачать это репо.
Строите и предоставьте определенный DevContainer.

Настройка через GitHub вручную

Продолжить с общих шагов настройки.
Клонировать или скачать это репо.
Убедитесь, что rye установлен и доступен.
В каталоге репо, запустите rye sync --no-lock .

Настройка через PYPI

Продолжить с общих шагов настройки.
Создайте и активируйте DevContainer или виртуальную среду Python 3.12.
Установите через PYPI: pip install -U podgenai .

Использование

Использование может быть в качестве приложения командной строки или в качестве библиотеки Python. По умолчанию сгенерированный mp3 -файл будет записан в текущий рабочий каталог. По состоянию на 2024 год типичная стоимость на поколение составляет от 1 до 2 долларов США, более конкретно менее 0,10 доллара США за подтопию. Временное время составляет менее трех минут.

Советы по использованию

Если запрашиваемая тема не может генерировать подтопики из -за отказа, повторно повторите несколько раз, так как она может преуспеть с несколькими попытками. Если это не так, попробуйте перефразировать его, возможно, чтобы быть более широким, более узким или более фактическим. До двух попыток предпринимается за пробег, хотя первая попытка повторно использует дисковый кеш, если будет доступно.
Для потенциально более длительного списка покрываемых подтем, рассмотрите возможность добавления суффикса «(unabridged)» к запрошенной теме, например, «pytorch (unabridged)».
В случае, если тема не будет произведена в начале подкаста, удалить ./work/<topic>/1.*.mp3 и регенерировать вывод.
Для необязательного создания изображения обложки для вашей темы можно использовать этот пользовательский GPT.
Чтобы попытаться генерация на иностранном языке, укажите название на желаемом языке, а также скол префикс названия языка, например, «México (Español)». Если поколение отказано в первый раз, попробуйте еще раз. Также обратитесь и используйте вариант --no-markers .

Использование в качестве приложения

Справка об использовании скопирована ниже:

 $ python -m podgenai -h
Usage: python -m podgenai [OPTIONS]

  Generate and write an audiobook podcast mp3 file for the given topic to the given output file path.

Options:
  -t, --topic TEXT                Topic. If not given, the user is prompted for it.
  -p, --path PATH                 Output file or directory path. If an intended file path, it must have an ".mp3"
                                  suffix. If a directory, it must exist, and the file name is auto-determined. If not
                                  given, the output file is written to the current working directory with an auto-
                                  determined file name.
  -s, --max-sections INTEGER RANGE
                                  Maximum number of sections, between 3 and 100. If not given, it is unrestricted.
                                  [3<=x<=100]
  -m, --markers / -nm, --no-markers
                                  Include markers at the start or end of sections in the generated audio. If
                                  `--markers`, markers are included, and this is the default. If `--no-markers`,
                                  markers are excluded, as can be appropriate for foreign-language generation.
  -c, --confirm / -nc, --no-confirm
                                  Confirm before full-text and speech generation. If `--confirm`, a confirmation is
                                  interactively sought as each step of the workflow progresses, and this is the
                                  default. If `--no-confirm`, the full-text and speech are generated without
                                  confirmations.
  -h, --help                      Show this message and exit.

Примеры использования:

 $ python -m podgenai -t "My favorite topic"

$ python -m podgenai -t "My favorite topic" -p ~/Downloads/

$ python -m podgenai -t "My favorite topic" -p ~/Downloads/topic.mp3 -nc

$ python -m podgenai -t "L'histoire de Napoléon Bonaparte (français)" -nm

Использование в качестве библиотеки

 >> > from podgenai import generate_media
>> > import inspect

>> > print ( inspect . signature ( generate_media ))
( topic : str , * , output_path : Optional [ pathlib . Path ] = None , max_sections : Optional [ int ] = None , markers : bool = True , confirm : bool = False ) - > pathlib . Path

>> > print ( inspect . getdoc ( generate_media ))

 Return the output path after generating and writing an audiobook podcast to file for the given topic.

Params:
* `topic`: Topic.
* `path`: Output file or directory path.
    If an intended file path, it must have an ".mp3" suffix. If a directory, it must exist, and the file name is auto-determined.
    If not given, the output file is written to the repo directory with an auto-determined file name.
* `max_sections`: Maximum number of sections to generate. It is between 3 and 100. It is unrestricted if not given.
* `markers`: Include markers at the start or end of sections in the generated audio.
    If true, markers are included. If false, markers are excluded, as can be appropriate for foreign-language generation. Its default is true.
* `confirm`: Confirm before full-text and speech generation.
    If true, a confirmation is interactively sought after generating and printing the list of subtopics, before generating the full-text, and also before generating the speech. Its default is false.

If failed, a subclass of the `podgenai.exceptions.Error` exception is raised.

Кеш

Текстовые и речевые сегменты находятся на местном уровне на диске в каталоге ./work/<topic> . Они могут быть удалены вручную. Это удаление в настоящее время не является автоматическим. Более того, в настоящее время может потребоваться удаление одного или нескольких применимых кэшированных файлов, если кэш должен быть обойден.

Отказ от ответственности

_{Это программное обеспечение предоставляется «как есть» без гарантии любого рода, явного или подразумеваемого, включая, помимо прочего, гарантии товарной пригодности, пригодности для определенной цели и неинфекции. Ни в коем случае авторы или владельцы авторских прав не будут нести ответственность за любые претензии, ущерб или другую ответственность, будь то в действии контракта, деликте или иным образом, возникающих из, из -за или в связи с программным обеспечением или использования или других сделок в программном обеспечении.}

_{Пользователи должны знать, что как текст, так и звук сгенерированных файлов производятся с помощью искусственного интеллекта (ИИ) на основе приведенных входов и данных, доступных для модели ИИ во время генерации. Таким образом, могут возникнуть неточности, ошибки или непреднамеренное содержание. Пользователям рекомендуется проявлять осторожность и подтвердить точность и уместность сгенерированного контента до любого использования или зависимости.}

_{Вы несете ответственность за затраты, связанные с использованием API OpenAI в соответствии с требованиями программного обеспечения, и вы должны соблюдать условия обслуживания OpenAI. Функциональность программного обеспечения зависит от доступности и функциональности внешних служб и программного обеспечения, включая, помимо прочего, API OpenAI и FFMPEG, над которым авторы не имеют контроля.}

_{Использование ключа API OpenAI и любого сгенерированного контента должно соответствовать всем применимым законам и правилам, включая законы об авторском праве и условия обслуживания платформы OpenAI. Вы несете единоличную ответственность за обеспечение использования программного обеспечения и любого сгенерированного контента, соответствующего условиям обслуживания OpenAI и любых других применимых законов и правил.}

_{Это программное обеспечение лицензируется по ГНУ меньшей общедоступной публичной лицензии (LGPL), которая позволяет как частное, так и коммерческое использование, модификацию и распределение при условии условий, изложенных в LGPL. Вы должны были получить копию GNU Lesser General Public Public License вместе с этой программой. Если нет, см. Http://www.gnu.org/licenses/.}

_{Авторы не претендуют на владение каким -либо контентом, сгенерированным с использованием этого программного обеспечения. Ответственность за использование любого сгенерированного контента остается у пользователя. Пользователи должны проявлять осторожность и должную осмотрительность, чтобы гарантировать, что сгенерированный контент не нарушает права третьих лиц.}

_{Этот отказ от ответственности может быть изменен без предварительного уведомления. Вы обязаны периодически пересматривать его для обновлений.}

Расширять

Дополнительная информация

Версия 0.8.0
Тип Другой исходный код
Время обновления 2025-03-01
размер 40.67KB
От Github

Связанные приложения

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

podgenai

Podgenai

Ссылки

Подход

Образцы

Настраивать

Общая настройка

Настройка через GitHub с помощью DevContainer

Настройка через GitHub вручную

Настройка через PYPI

Использование

Советы по использованию

Использование в качестве приложения

Использование в качестве библиотеки

Кеш

Отказ от ответственности

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf