podgenai Download - podgenai Quellcode herunterladen

podgenai

Anderer Quellcode

0.8.0

Herunterladen

Podgenai

Podgenai ist eine Python 3.12-Anwendung, um eine Informations-Einspracher-Hörbuch-/Podcast-MP3-Datei zu einem bestimmten Thema unter Verwendung des GPT-4 LLM zu generieren. Die gezielte Dauer der generierten Datei beträgt eine Stunde, obwohl die generierte Dauer variiert. Ein finanzierter OpenAI -API -Schlüssel ist erforderlich.

Links

Untertitel	Link
Repo	https://github.com/impredicative/podgenai
Changelog	https://github.com/impredicative/podgenai/releases
Paket	https://pypi.org/project/podgenai
Podcast	https://podcasters.spotify.com/pod/podgenai
Podcast RSS	https://anchor.fm/s/f4868644/podcast/rss

Ansatz

Die gpt-4o und tts-1 Modelle werden verwendet. Für ein bestimmtes Thema lautet der hochrangige Referenzansatz:

Die anwendbaren Unterthemen werden mit dem LLM aufgeführt. Wenn das Thema der LLM jedoch unbekannt ist, wird der Prozess abgebrochen.
Die Stimme wird mit dem LLM aus vier Auswahlmöglichkeiten ausgewählt.
Gleichzeitig werden für jeden subtopischen Text und die entsprechende Sprache unter Verwendung des LLM bzw. TTS erzeugt.
Die Sprachdateien werden mit ffmpeg verkettet.

Obwohl es manchmal eine semantische Wiederholung von Inhalten über Subtopika gibt, wurde dies absichtlich nicht "optimiert", da diese Wiederholung wichtiger Punkte beim Lernen und beim Auswendiglernen helfen kann. Um tiefer in ein bestimmtes Subtopiker eintauchen zu können, kann man versuchen, eine neue Datei nur dafür zu erstellen.

Proben

Diese generierten MP3 -Dateien können heruntergeladen werden. Tatsächlich bilden diese auch eine minimale manuelle Testsuite, wobei der einzigartige Zweck jeder Probe angegeben ist. Zur Erinnerung, die Stimme wird vom LLM ausgewählt.

Es gibt auch einen verwandten Podcast (RSS), zu dem Episoden zu zusätzlichen Themen im Laufe der Zeit manuell veröffentlicht werden können.

Für nicht-technische Themen, 1,0x für technische Themen und 0,95x für Fremdsprachenthemen, wird eine Wiedergabegeschwindigkeit von 1,05X für nicht-technische Themen empfohlen.

Stimme	Name	Zweck
Standard	Pytorch	Technische Inhaltegenerierung
Standard	Fortgeschrittener Pytorch	Erweiterte technische Inhaltegenerierung
Standard	Tipps für das Vorstellungsgespräch von Software Engineer -Vorstellungsgesprächs	Standard -Sprachauswahl
Emotional	New York City: Gegenwart und Zukunft	Nicht-technische Inhaltsgenerierung
Emotional	Ein gutes Leben führen	Auswahl der emotionalen Sprachauswahl
Standard	Künstliche allgemeine Intelligenz (AGI): Ansätze und Algorithmen	Nicht-hierarchisch abgeflachte einstufige subtopische Listendurchsetzung
Weiblich	Menschliches Kreislaufsystem (ungekürzt)	Implizite Themenunterstützung für das ungekürzte Suffix
Weiblich	Buffy the Vampire Slayer	Auswahl der weiblichen Stimme
Männlich	Bitcoin für Nerds	Männliche Sprachauswahl

Aufstellen

Gemeinsames Setup

Erstellen Sie im Arbeitsverzeichnis eine Datei namens .env mit der vorgesehenen Umgebungsvariable OPENAI_API_KEY=<your OpenAI API key> oder stellen Sie sie auf andere Weise fest.
Optional setzen Sie auch die Umgebungsvariable PODGENAI_OPENAI_MAX_WORKERS=32 für eine schnellere Erzeugung, wobei der Standardwert 16 liegt.
Stellen Sie sicher, dass ffmpeg verfügbar ist. Dies ist automatisch, wenn die mitgelieferte Definition von DevContainer verwendet wird.
Setzen Sie das Setup über GitHub oder PYPI wie unten fort.

Setup über GitHub mit DevContainer einrichten

Fahren Sie von den gemeinsamen Setup -Schritten fort.
Klonen oder Laden Sie dieses Repo herunter.
Erstellen und Bereitstellung des definierten DevContainer.

Über GitHub manuell einrichten

Fahren Sie von den gemeinsamen Setup -Schritten fort.
Klonen oder Laden Sie dieses Repo herunter.
Stellen Sie sicher, dass rye installiert und verfügbar ist.
Rennen Sie im Repo-Verzeichnis rye sync --no-lock .

Setup über PYPI

Fahren Sie von den gemeinsamen Setup -Schritten fort.
Erstellen und aktivieren Sie eine Python 3.12 DevContainer oder eine virtuelle Umgebung.
Installieren Sie über PYPI: pip install -U podgenai .

Verwendung

Die Verwendung kann als Befehlszeilenanwendung oder als Python-Bibliothek erfolgen. Standardmäßig wird die generierte MP3 -Datei in das aktuelle Arbeitsverzeichnis geschrieben. Ab 2024 betragen die typischen Kosten pro Generation 1 bis 2 USD, insbesondere unter 0,10 USD pro subtopisch. Die Zeit ist unter drei Minuten.

Nutzungstipps

Wenn ein angefordertes Thema aufgrund einer Ablehnung keine Subtopie generiert, wiederholen Sie dies bis zu einigen Male, da dies bei mehreren Versuchen erfolgreich sein kann. Wenn dies nicht der Fall ist, versuchen Sie es neu, um es neu zu formulieren, vielleicht um breiter oder schmaler oder sachlicher zu sein. Es werden bis zu zwei Versuche pro Lauf unternommen, obwohl der erste Versuch den Festplattencache wiederverwendet wird, falls verfügbar.
Für eine potenziell längere Liste der abgedeckten Unterthemen sollten Sie das Suffix "(ungekürzt)" an das angeforderte Thema anhängen, z. B. "Pytorch (ungekürzt)".
Falls das Thema zu Beginn eines Podcasts nicht gesprochen wird, löschen ./work/<topic>/1.*.mp3 und regenerieren Sie die Ausgabe.
Um optional ein Cover -Kunstbild für Ihr Thema zu generieren, kann diese benutzerdefinierte GPT verwendet werden.
Geben Sie den Titel in der gewünschten Sprache zusammen mit einem Präfix des Sprachnamens, z. B. "México (Español)", den Titel in der gewünschten Sprache an. Wenn die Generation zum ersten Mal abgelehnt wird, versuchen Sie es erneut. Beziehen Sie sich auch auf die Option --no-markers .

Verwendung als Anwendung

Die Nutzungshilfe wird unten kopiert:

 $ python -m podgenai -h
Usage: python -m podgenai [OPTIONS]

  Generate and write an audiobook podcast mp3 file for the given topic to the given output file path.

Options:
  -t, --topic TEXT                Topic. If not given, the user is prompted for it.
  -p, --path PATH                 Output file or directory path. If an intended file path, it must have an ".mp3"
                                  suffix. If a directory, it must exist, and the file name is auto-determined. If not
                                  given, the output file is written to the current working directory with an auto-
                                  determined file name.
  -s, --max-sections INTEGER RANGE
                                  Maximum number of sections, between 3 and 100. If not given, it is unrestricted.
                                  [3<=x<=100]
  -m, --markers / -nm, --no-markers
                                  Include markers at the start or end of sections in the generated audio. If
                                  `--markers`, markers are included, and this is the default. If `--no-markers`,
                                  markers are excluded, as can be appropriate for foreign-language generation.
  -c, --confirm / -nc, --no-confirm
                                  Confirm before full-text and speech generation. If `--confirm`, a confirmation is
                                  interactively sought as each step of the workflow progresses, and this is the
                                  default. If `--no-confirm`, the full-text and speech are generated without
                                  confirmations.
  -h, --help                      Show this message and exit.

Verwendungsbeispiele:

 $ python -m podgenai -t "My favorite topic"

$ python -m podgenai -t "My favorite topic" -p ~/Downloads/

$ python -m podgenai -t "My favorite topic" -p ~/Downloads/topic.mp3 -nc

$ python -m podgenai -t "L'histoire de Napoléon Bonaparte (français)" -nm

Nutzung als Bibliothek

 >> > from podgenai import generate_media
>> > import inspect

>> > print ( inspect . signature ( generate_media ))
( topic : str , * , output_path : Optional [ pathlib . Path ] = None , max_sections : Optional [ int ] = None , markers : bool = True , confirm : bool = False ) - > pathlib . Path

>> > print ( inspect . getdoc ( generate_media ))

 Return the output path after generating and writing an audiobook podcast to file for the given topic.

Params:
* `topic`: Topic.
* `path`: Output file or directory path.
    If an intended file path, it must have an ".mp3" suffix. If a directory, it must exist, and the file name is auto-determined.
    If not given, the output file is written to the repo directory with an auto-determined file name.
* `max_sections`: Maximum number of sections to generate. It is between 3 and 100. It is unrestricted if not given.
* `markers`: Include markers at the start or end of sections in the generated audio.
    If true, markers are included. If false, markers are excluded, as can be appropriate for foreign-language generation. Its default is true.
* `confirm`: Confirm before full-text and speech generation.
    If true, a confirmation is interactively sought after generating and printing the list of subtopics, before generating the full-text, and also before generating the speech. Its default is false.

If failed, a subclass of the `podgenai.exceptions.Error` exception is raised.

Cache

Text- und Sprachsegmente werden lokal auf der Festplatte im Verzeichnis ./work/<topic> zwischengespeichert. Sie können manuell gelöscht werden. Diese Löschung ist derzeit nicht automatisch. Darüber hinaus kann derzeit eine oder mehr anwendbare zwischengespeicherte Dateien gelöscht werden, wenn der Cache umgangen werden soll.

Haftungsausschluss

_{Diese Software wird "so" wie ist "ohne Garantie jeglicher Art, ausdrücklich oder stillschweigend, einschließlich, aber nicht beschränkt auf die Gewährleistung der Handelsfähigkeit, die Eignung für einen bestimmten Zweck und die Nichtverletzung. In keinem Fall sind die Autoren oder Urheberrechtsinhaber für Ansprüche, Schäden oder andere Haftungen bei Vertragsmaßnahmen, unerlaubter Handlung oder anderweitig, die sich aus oder in Verbindung mit der Software oder der Verwendung oder anderen Geschäften in der Software ergeben.}

_{Benutzer sollten sich bewusst sein, dass sowohl der Text als auch das Audio der generierten Dateien von Artificial Intelligence (AI) erstellt werden, basierend auf den angegebenen Eingaben und den Daten, die dem KI -Modell zum Zeitpunkt der Generation verfügbar sind. Daher können Ungenauigkeiten, Fehler oder unbeabsichtigte Inhalte auftreten. Den Benutzern wird empfohlen, Vorsicht zu wechseln und die Genauigkeit und Angemessenheit des generierten Inhalts vor Verwendung oder Vertrauen zu überprüfen.}

_{Sie sind für die Kosten für die Verwendung der OpenAI -API verantwortlich, die von der Software erforderlich ist, und Sie müssen die OpenAI -API -Nutzungsbedingungen einhalten. Die Funktionalität der Software hängt von der Verfügbarkeit und Funktionalität von externen Diensten und Software ab, einschließlich, aber nicht beschränkt auf die OpenAI -API und FFMPEG, über die die Autoren keine Kontrolle haben.}

_{Die Verwendung des OpenAI -API -Schlüssels und der generierten Inhalte muss allen geltenden Gesetzen und Vorschriften entsprechen, einschließlich Urheberrechtsgesetzen und den Nutzungsbedingungen der OpenAI -Plattform. Sie sind ausschließlich dafür verantwortlich, dass Ihre Verwendung der Software und alle generierten Inhalte den OpenAI -Nutzungsbedingungen und anderen geltenden Gesetzen und Vorschriften entsprechen.}

_{Diese Software ist im Rahmen der GNU Lesser General Public Lizenz (LGPL) lizenziert, die sowohl private als auch kommerzielle Nutzung, Änderung und Verteilung ermöglicht, vorbehaltlich der in der LGPL festgelegten Bedingungen. Sie sollten zusammen mit diesem Programm eine Kopie der GNU Lesser -allgemeinen öffentlichen Lizenz erhalten haben. Wenn nicht, siehe http://www.gnu.org/licenses/.}

_{Die Autoren beanspruchen kein Eigentum an Inhalten, die mit dieser Software generiert werden. Die Verantwortung für die Verwendung aller generierten Inhalte liegt beim Benutzer. Benutzer sollten Vorsicht und Sorgfalt eingehen, um sicherzustellen, dass generierte Inhalte die Rechte Dritter nicht verletzt.}

_{Dieser Haftungsausschluss kann sich ohne vorherige Ankündigung ändern. Es liegt in Ihrer Verantwortung, es regelmäßig für Updates zu überprüfen.}

Expandieren

Zusätzliche Informationen

Version 0.8.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-03-01
Größe 40.67KB
Kommt von Github

Ähnliche Anwendungen

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

podgenai

Podgenai

Links

Ansatz

Proben

Aufstellen

Gemeinsames Setup

Setup über GitHub mit DevContainer einrichten

Über GitHub manuell einrichten

Setup über PYPI

Verwendung

Nutzungstipps

Verwendung als Anwendung

Nutzung als Bibliothek

Cache

Haftungsausschluss

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf