Podgenai -это приложение Python 3.12 для генерации информационного файла MP3 с одним ди-ди-ди-ди-ди-ди-ди-позвоночником по данной теме с использованием GPT-4 LLM. Целевая продолжительность сгенерированного файла составляет час, хотя сгенерированная продолжительность варьируется. Требуется финансируемый ключ API OpenAI.
| Подпись | Связь |
|---|---|
| Репо | https://github.com/impredicative/podgenai |
| Изменение | https://github.com/impredicative/podgenai/releases |
| Упаковка | https://pypi.org/project/podgenai |
| Подкаст | https://podcasters.spotify.com/pod/podgenai |
| Подкаст RSS | https://anchor.fm/s/f4868644/podcast/rss |
Модели gpt-4o и tts-1 используются. Для данной темы, справочный подход высокого уровня:
ffmpeg .Хотя иногда может существовать какое -то семантическое повторение контента по всему подтемам, это намеренно не было «оптимизировано», потому что это повторение важных моментов может помочь в обучении и запоминании. Чтобы глубже погрузиться в определенную подторику, можно попытаться создать новый файл только для него.
Эти сгенерированные файлы MP3 доступны для скачивания. По сути, они также составляют минимальный набор ручных испытаний с уникальной целью каждого образца. В качестве напоминания, голос выбирается LLM.
Существует также связанный подкаст (RSS), на который эпизоды по дополнительным темам могут быть опубликованы вручную с течением времени.
Скорость воспроизведения 1,05x рекомендуется для нетехнических тем, 1,0x для технических тем и 0,95x для тематических тем по иностранным языкам.
| Голос | Имя | Цель |
|---|---|---|
| По умолчанию | Пирог | Техническое поколение |
| По умолчанию | Advanced Pytorch | Расширенная генерация технического контента |
| По умолчанию | Советы по собеседованию инженера программного обеспечения | Выбор голоса по умолчанию |
| Эмоциональный | Нью -Йорк: настоящее и будущее | Нетехническое поколение содержания |
| Эмоциональный | Жить хорошей жизнью | Эмоциональный выбор голоса |
| По умолчанию | Искусственный общий интеллект (AGI): подходы и алгоритмы | Не иерархическое сглаженное одноуровневое подтопительное правоприменение |
| Женский | Система кровообращения человека (без применения) | Неявная тема |
| Женский | Баффи, вампирская убийца | Женский выбор голоса |
| Мужской | Биткойн для ботаников | Мужской выбор голоса |
.env с предполагаемой переменной среды OPENAI_API_KEY=<your OpenAI API key> или установите его по -другому.PODGENAI_OPENAI_MAX_WORKERS=32 для более быстрого поколения, при этом значение по умолчанию составляет 16.ffmpeg доступен. Это автоматически при использовании включенного определения DevContainer.rye установлен и доступен.rye sync --no-lock .pip install -U podgenai . Использование может быть в качестве приложения командной строки или в качестве библиотеки Python. По умолчанию сгенерированный mp3 -файл будет записан в текущий рабочий каталог. По состоянию на 2024 год типичная стоимость на поколение составляет от 1 до 2 долларов США, более конкретно менее 0,10 доллара США за подтопию. Временное время составляет менее трех минут.
./work/<topic>/1.*.mp3 и регенерировать вывод.--no-markers .Справка об использовании скопирована ниже:
$ python -m podgenai -h
Usage: python -m podgenai [OPTIONS]
Generate and write an audiobook podcast mp3 file for the given topic to the given output file path.
Options:
-t, --topic TEXT Topic. If not given, the user is prompted for it.
-p, --path PATH Output file or directory path. If an intended file path, it must have an ".mp3"
suffix. If a directory, it must exist, and the file name is auto-determined. If not
given, the output file is written to the current working directory with an auto-
determined file name.
-s, --max-sections INTEGER RANGE
Maximum number of sections, between 3 and 100. If not given, it is unrestricted.
[3<=x<=100]
-m, --markers / -nm, --no-markers
Include markers at the start or end of sections in the generated audio. If
`--markers`, markers are included, and this is the default. If `--no-markers`,
markers are excluded, as can be appropriate for foreign-language generation.
-c, --confirm / -nc, --no-confirm
Confirm before full-text and speech generation. If `--confirm`, a confirmation is
interactively sought as each step of the workflow progresses, and this is the
default. If `--no-confirm`, the full-text and speech are generated without
confirmations.
-h, --help Show this message and exit.
Примеры использования:
$ python -m podgenai -t "My favorite topic"
$ python -m podgenai -t "My favorite topic" -p ~/Downloads/
$ python -m podgenai -t "My favorite topic" -p ~/Downloads/topic.mp3 -nc
$ python -m podgenai -t "L'histoire de Napoléon Bonaparte (français)" -nm
>> > from podgenai import generate_media
>> > import inspect
>> > print ( inspect . signature ( generate_media ))
( topic : str , * , output_path : Optional [ pathlib . Path ] = None , max_sections : Optional [ int ] = None , markers : bool = True , confirm : bool = False ) - > pathlib . Path
>> > print ( inspect . getdoc ( generate_media )) Return the output path after generating and writing an audiobook podcast to file for the given topic.
Params:
* `topic`: Topic.
* `path`: Output file or directory path.
If an intended file path, it must have an ".mp3" suffix. If a directory, it must exist, and the file name is auto-determined.
If not given, the output file is written to the repo directory with an auto-determined file name.
* `max_sections`: Maximum number of sections to generate. It is between 3 and 100. It is unrestricted if not given.
* `markers`: Include markers at the start or end of sections in the generated audio.
If true, markers are included. If false, markers are excluded, as can be appropriate for foreign-language generation. Its default is true.
* `confirm`: Confirm before full-text and speech generation.
If true, a confirmation is interactively sought after generating and printing the list of subtopics, before generating the full-text, and also before generating the speech. Its default is false.
If failed, a subclass of the `podgenai.exceptions.Error` exception is raised.
Текстовые и речевые сегменты находятся на местном уровне на диске в каталоге ./work/<topic> . Они могут быть удалены вручную. Это удаление в настоящее время не является автоматическим. Более того, в настоящее время может потребоваться удаление одного или нескольких применимых кэшированных файлов, если кэш должен быть обойден.
Это программное обеспечение предоставляется «как есть» без гарантии любого рода, явного или подразумеваемого, включая, помимо прочего, гарантии товарной пригодности, пригодности для определенной цели и неинфекции. Ни в коем случае авторы или владельцы авторских прав не будут нести ответственность за любые претензии, ущерб или другую ответственность, будь то в действии контракта, деликте или иным образом, возникающих из, из -за или в связи с программным обеспечением или использования или других сделок в программном обеспечении.
Пользователи должны знать, что как текст, так и звук сгенерированных файлов производятся с помощью искусственного интеллекта (ИИ) на основе приведенных входов и данных, доступных для модели ИИ во время генерации. Таким образом, могут возникнуть неточности, ошибки или непреднамеренное содержание. Пользователям рекомендуется проявлять осторожность и подтвердить точность и уместность сгенерированного контента до любого использования или зависимости.
Вы несете ответственность за затраты, связанные с использованием API OpenAI в соответствии с требованиями программного обеспечения, и вы должны соблюдать условия обслуживания OpenAI. Функциональность программного обеспечения зависит от доступности и функциональности внешних служб и программного обеспечения, включая, помимо прочего, API OpenAI и FFMPEG, над которым авторы не имеют контроля.
Использование ключа API OpenAI и любого сгенерированного контента должно соответствовать всем применимым законам и правилам, включая законы об авторском праве и условия обслуживания платформы OpenAI. Вы несете единоличную ответственность за обеспечение использования программного обеспечения и любого сгенерированного контента, соответствующего условиям обслуживания OpenAI и любых других применимых законов и правил.
Это программное обеспечение лицензируется по ГНУ меньшей общедоступной публичной лицензии (LGPL), которая позволяет как частное, так и коммерческое использование, модификацию и распределение при условии условий, изложенных в LGPL. Вы должны были получить копию GNU Lesser General Public Public License вместе с этой программой. Если нет, см. Http://www.gnu.org/licenses/.
Авторы не претендуют на владение каким -либо контентом, сгенерированным с использованием этого программного обеспечения. Ответственность за использование любого сгенерированного контента остается у пользователя. Пользователи должны проявлять осторожность и должную осмотрительность, чтобы гарантировать, что сгенерированный контент не нарушает права третьих лиц.
Этот отказ от ответственности может быть изменен без предварительного уведомления. Вы обязаны периодически пересматривать его для обновлений.