Podgenai ist eine Python 3.12-Anwendung, um eine Informations-Einspracher-Hörbuch-/Podcast-MP3-Datei zu einem bestimmten Thema unter Verwendung des GPT-4 LLM zu generieren. Die gezielte Dauer der generierten Datei beträgt eine Stunde, obwohl die generierte Dauer variiert. Ein finanzierter OpenAI -API -Schlüssel ist erforderlich.
| Untertitel | Link |
|---|---|
| Repo | https://github.com/impredicative/podgenai |
| Changelog | https://github.com/impredicative/podgenai/releases |
| Paket | https://pypi.org/project/podgenai |
| Podcast | https://podcasters.spotify.com/pod/podgenai |
| Podcast RSS | https://anchor.fm/s/f4868644/podcast/rss |
Die gpt-4o und tts-1 Modelle werden verwendet. Für ein bestimmtes Thema lautet der hochrangige Referenzansatz:
ffmpeg verkettet.Obwohl es manchmal eine semantische Wiederholung von Inhalten über Subtopika gibt, wurde dies absichtlich nicht "optimiert", da diese Wiederholung wichtiger Punkte beim Lernen und beim Auswendiglernen helfen kann. Um tiefer in ein bestimmtes Subtopiker eintauchen zu können, kann man versuchen, eine neue Datei nur dafür zu erstellen.
Diese generierten MP3 -Dateien können heruntergeladen werden. Tatsächlich bilden diese auch eine minimale manuelle Testsuite, wobei der einzigartige Zweck jeder Probe angegeben ist. Zur Erinnerung, die Stimme wird vom LLM ausgewählt.
Es gibt auch einen verwandten Podcast (RSS), zu dem Episoden zu zusätzlichen Themen im Laufe der Zeit manuell veröffentlicht werden können.
Für nicht-technische Themen, 1,0x für technische Themen und 0,95x für Fremdsprachenthemen, wird eine Wiedergabegeschwindigkeit von 1,05X für nicht-technische Themen empfohlen.
| Stimme | Name | Zweck |
|---|---|---|
| Standard | Pytorch | Technische Inhaltegenerierung |
| Standard | Fortgeschrittener Pytorch | Erweiterte technische Inhaltegenerierung |
| Standard | Tipps für das Vorstellungsgespräch von Software Engineer -Vorstellungsgesprächs | Standard -Sprachauswahl |
| Emotional | New York City: Gegenwart und Zukunft | Nicht-technische Inhaltsgenerierung |
| Emotional | Ein gutes Leben führen | Auswahl der emotionalen Sprachauswahl |
| Standard | Künstliche allgemeine Intelligenz (AGI): Ansätze und Algorithmen | Nicht-hierarchisch abgeflachte einstufige subtopische Listendurchsetzung |
| Weiblich | Menschliches Kreislaufsystem (ungekürzt) | Implizite Themenunterstützung für das ungekürzte Suffix |
| Weiblich | Buffy the Vampire Slayer | Auswahl der weiblichen Stimme |
| Männlich | Bitcoin für Nerds | Männliche Sprachauswahl |
.env mit der vorgesehenen Umgebungsvariable OPENAI_API_KEY=<your OpenAI API key> oder stellen Sie sie auf andere Weise fest.PODGENAI_OPENAI_MAX_WORKERS=32 für eine schnellere Erzeugung, wobei der Standardwert 16 liegt.ffmpeg verfügbar ist. Dies ist automatisch, wenn die mitgelieferte Definition von DevContainer verwendet wird.rye installiert und verfügbar ist.rye sync --no-lock .pip install -U podgenai . Die Verwendung kann als Befehlszeilenanwendung oder als Python-Bibliothek erfolgen. Standardmäßig wird die generierte MP3 -Datei in das aktuelle Arbeitsverzeichnis geschrieben. Ab 2024 betragen die typischen Kosten pro Generation 1 bis 2 USD, insbesondere unter 0,10 USD pro subtopisch. Die Zeit ist unter drei Minuten.
./work/<topic>/1.*.mp3 und regenerieren Sie die Ausgabe.--no-markers .Die Nutzungshilfe wird unten kopiert:
$ python -m podgenai -h
Usage: python -m podgenai [OPTIONS]
Generate and write an audiobook podcast mp3 file for the given topic to the given output file path.
Options:
-t, --topic TEXT Topic. If not given, the user is prompted for it.
-p, --path PATH Output file or directory path. If an intended file path, it must have an ".mp3"
suffix. If a directory, it must exist, and the file name is auto-determined. If not
given, the output file is written to the current working directory with an auto-
determined file name.
-s, --max-sections INTEGER RANGE
Maximum number of sections, between 3 and 100. If not given, it is unrestricted.
[3<=x<=100]
-m, --markers / -nm, --no-markers
Include markers at the start or end of sections in the generated audio. If
`--markers`, markers are included, and this is the default. If `--no-markers`,
markers are excluded, as can be appropriate for foreign-language generation.
-c, --confirm / -nc, --no-confirm
Confirm before full-text and speech generation. If `--confirm`, a confirmation is
interactively sought as each step of the workflow progresses, and this is the
default. If `--no-confirm`, the full-text and speech are generated without
confirmations.
-h, --help Show this message and exit.
Verwendungsbeispiele:
$ python -m podgenai -t "My favorite topic"
$ python -m podgenai -t "My favorite topic" -p ~/Downloads/
$ python -m podgenai -t "My favorite topic" -p ~/Downloads/topic.mp3 -nc
$ python -m podgenai -t "L'histoire de Napoléon Bonaparte (français)" -nm
>> > from podgenai import generate_media
>> > import inspect
>> > print ( inspect . signature ( generate_media ))
( topic : str , * , output_path : Optional [ pathlib . Path ] = None , max_sections : Optional [ int ] = None , markers : bool = True , confirm : bool = False ) - > pathlib . Path
>> > print ( inspect . getdoc ( generate_media )) Return the output path after generating and writing an audiobook podcast to file for the given topic.
Params:
* `topic`: Topic.
* `path`: Output file or directory path.
If an intended file path, it must have an ".mp3" suffix. If a directory, it must exist, and the file name is auto-determined.
If not given, the output file is written to the repo directory with an auto-determined file name.
* `max_sections`: Maximum number of sections to generate. It is between 3 and 100. It is unrestricted if not given.
* `markers`: Include markers at the start or end of sections in the generated audio.
If true, markers are included. If false, markers are excluded, as can be appropriate for foreign-language generation. Its default is true.
* `confirm`: Confirm before full-text and speech generation.
If true, a confirmation is interactively sought after generating and printing the list of subtopics, before generating the full-text, and also before generating the speech. Its default is false.
If failed, a subclass of the `podgenai.exceptions.Error` exception is raised.
Text- und Sprachsegmente werden lokal auf der Festplatte im Verzeichnis ./work/<topic> zwischengespeichert. Sie können manuell gelöscht werden. Diese Löschung ist derzeit nicht automatisch. Darüber hinaus kann derzeit eine oder mehr anwendbare zwischengespeicherte Dateien gelöscht werden, wenn der Cache umgangen werden soll.
Diese Software wird "so" wie ist "ohne Garantie jeglicher Art, ausdrücklich oder stillschweigend, einschließlich, aber nicht beschränkt auf die Gewährleistung der Handelsfähigkeit, die Eignung für einen bestimmten Zweck und die Nichtverletzung. In keinem Fall sind die Autoren oder Urheberrechtsinhaber für Ansprüche, Schäden oder andere Haftungen bei Vertragsmaßnahmen, unerlaubter Handlung oder anderweitig, die sich aus oder in Verbindung mit der Software oder der Verwendung oder anderen Geschäften in der Software ergeben.
Benutzer sollten sich bewusst sein, dass sowohl der Text als auch das Audio der generierten Dateien von Artificial Intelligence (AI) erstellt werden, basierend auf den angegebenen Eingaben und den Daten, die dem KI -Modell zum Zeitpunkt der Generation verfügbar sind. Daher können Ungenauigkeiten, Fehler oder unbeabsichtigte Inhalte auftreten. Den Benutzern wird empfohlen, Vorsicht zu wechseln und die Genauigkeit und Angemessenheit des generierten Inhalts vor Verwendung oder Vertrauen zu überprüfen.
Sie sind für die Kosten für die Verwendung der OpenAI -API verantwortlich, die von der Software erforderlich ist, und Sie müssen die OpenAI -API -Nutzungsbedingungen einhalten. Die Funktionalität der Software hängt von der Verfügbarkeit und Funktionalität von externen Diensten und Software ab, einschließlich, aber nicht beschränkt auf die OpenAI -API und FFMPEG, über die die Autoren keine Kontrolle haben.
Die Verwendung des OpenAI -API -Schlüssels und der generierten Inhalte muss allen geltenden Gesetzen und Vorschriften entsprechen, einschließlich Urheberrechtsgesetzen und den Nutzungsbedingungen der OpenAI -Plattform. Sie sind ausschließlich dafür verantwortlich, dass Ihre Verwendung der Software und alle generierten Inhalte den OpenAI -Nutzungsbedingungen und anderen geltenden Gesetzen und Vorschriften entsprechen.
Diese Software ist im Rahmen der GNU Lesser General Public Lizenz (LGPL) lizenziert, die sowohl private als auch kommerzielle Nutzung, Änderung und Verteilung ermöglicht, vorbehaltlich der in der LGPL festgelegten Bedingungen. Sie sollten zusammen mit diesem Programm eine Kopie der GNU Lesser -allgemeinen öffentlichen Lizenz erhalten haben. Wenn nicht, siehe http://www.gnu.org/licenses/.
Die Autoren beanspruchen kein Eigentum an Inhalten, die mit dieser Software generiert werden. Die Verantwortung für die Verwendung aller generierten Inhalte liegt beim Benutzer. Benutzer sollten Vorsicht und Sorgfalt eingehen, um sicherzustellen, dass generierte Inhalte die Rechte Dritter nicht verletzt.
Dieser Haftungsausschluss kann sich ohne vorherige Ankündigung ändern. Es liegt in Ihrer Verantwortung, es regelmäßig für Updates zu überprüfen.