Téléchargement de podgenai - Téléchargement du code source podgenai

podgenai

Autre code source

0.8.0

Télécharger

podgenaï

Podgenai est une application Python 3.12 pour générer un fichier MP3 audio-speaker informationnel / podcast sur un sujet donné en utilisant le GPT-4 LLM. La durée ciblée du fichier généré est d'une heure, bien que la durée générée varie. Une clé API OpenAI financée est requise.

Links

Légende	Lien
Repo	https://github.com/impredicative/podgenai
Changelog	https://github.com/impredicative/podgenai/releases
Emballer	https://pypi.org/project/podgenai
Podcast	https://podcasters.spotify.com/pod/podgenai
RSS du podcast	https://anchor.fm/s/f4868644/podcast/rss

Approche

Les modèles gpt-4o et tts-1 sont utilisés. Pour un sujet donné, l'approche de référence de haut niveau est:

Les sous-thèmes applicables sont répertoriés à l'aide du LLM. Si toutefois le sujet est inconnu du LLM, le processus est interdit.
La voix est sélectionnée à l'aide du LLM à partir de quatre choix.
Parallèlement pour chaque sous-thèse, le texte et la parole correspondants sont générés à l'aide du LLM et du TTS respectivement.
Les fichiers vocaux sont concaténés à l'aide de ffmpeg .

Bien qu'il puisse parfois exister une répétition sémantique du contenu à travers les sous-thèmes, cela n'a pas intentionnellement été "optimisé" parce que cette répétition de points importants peut aider à l'apprentissage et à la mémorisation. Pour plonger plus profondément dans un sous-topique particulier, on peut essayer de créer un nouveau fichier juste pour cela.

Échantillons

Ces fichiers MP3 générés sont disponibles en téléchargement. En effet, ceux-ci constituent également une suite de test manuelle minimale, avec le but unique de chaque échantillon noté. Pour rappel, la voix est sélectionnée par le LLM.

Il existe également un podcast connexe (RSS) auquel les épisodes sur des sujets supplémentaires peuvent être affichés manuellement au fil du temps.

Une vitesse de lecture de 1,05x est recommandée pour des sujets non techniques, 1,0x pour les sujets techniques et 0,95x pour les sujets de langue étrangère.

Voix	Nom	But
Défaut	Pytorch	Génération de contenu technique
Défaut	Pytorch avancé	Génération de contenu technique avancé
Défaut	Conseils d'entretien d'emploi ingénieurs logiciels	Sélection de voix par défaut
Sensible	New York City: présent et futur	Génération de contenu non technique
Sensible	Vivre une bonne vie	Sélection de la voix émotive
Défaut	Intelligence générale artificielle (AGI): approches et algorithmes	Application de la liste subtologique à un niveau inlassable non hiérarchique
Femelle	Système circulatoire humain (non abrégé)	Support de sujet implicite pour le suffixe non abrégé
Femelle	Buffy The Vampire Slayer	Sélection de la voix féminine
Mâle	Bitcoin pour les nerds	Sélection de la voix masculine

Installation

Configuration commune

Dans le répertoire de travail, créez un fichier nommé .env , avec la variable d'environnement prévue OPENAI_API_KEY=<your OpenAI API key> , ou le définissez d'une manière différente.
Définissez également la variable d'environnement PODGENAI_OPENAI_MAX_WORKERS=32 pour une génération plus rapide, sa valeur par défaut étant de 16.
Assurez-vous que ffmpeg est disponible. Ceci est automatique si vous utilisez la définition de DevContainer incluse.
Continuez la configuration via GitHub ou PYPI comme ci-dessous.

Configuration via GitHub à l'aide de devctainer

Continuez à partir des étapes de configuration courantes.
Cloner ou télécharger ce dépôt.
Construisez et provisionnez le DevContainer défini.

Configuration via github manuellement

Continuez à partir des étapes de configuration communes.
Cloner ou télécharger ce dépôt.
Assurez-vous que rye est installé et disponible.
Dans le répertoire Repo, exécutez rye sync --no-lock .

Configuration via PYPI

Continuez à partir des étapes de configuration courantes.
Créez et activez un environnement Python 3.12 DevContainer ou Virtual.
Installer via PYPI: pip install -U podgenai .

Usage

L'utilisation peut être une application de ligne de commande ou en tant que bibliothèque Python. Par défaut, le fichier MP3 généré sera écrit dans le répertoire de travail actuel. En 2024, le coût typique par génération est de 1 à 2 USD, plus spécifiquement moins de 0,10 USD par sous-topique. Le temps pris est inférieur à trois minutes.

Conseils d'utilisation

Si un sujet demandé ne parvient pas à générer des sous-thèmes en raison d'un refus, réessayez jusqu'à quelques fois, car il peut réussir avec plusieurs tentatives. Si ce n'est pas le cas, essayez de le reformuler, peut-être pour être plus large ou plus étroit ou plus factuel. Jusqu'à deux tentatives sont faites par course, bien que la première tentative réutilisera le cache de disque si disponible.
Pour une liste potentiellement plus longue de sous-thèmes couverts, envisagez d'ajouter le suffixe "(non abrégé)" sur le sujet demandé, par exemple "pytorch (Unabridged)".
Dans le cas où le sujet ne parvient pas au début d'un podcast, supprimez ./work/<topic>/1.*.mp3 et régénérez la sortie.
Pour générer éventuellement une image de couverture pour votre sujet, ce GPT personnalisé peut être utilisé.
Pour tenter la génération dans une langue étrangère, spécifiez le titre dans la langue souhaitée avec un préfixe entre parenthèses du nom de la langue, par exemple "México (Español)". Si la génération est refusée la première fois, réessayez. Reportez-vous également et utilisez également l'option --no-markers .

Utilisation comme application

L'aide d'utilisation est copiée ci-dessous:

 $ python -m podgenai -h
Usage: python -m podgenai [OPTIONS]

  Generate and write an audiobook podcast mp3 file for the given topic to the given output file path.

Options:
  -t, --topic TEXT                Topic. If not given, the user is prompted for it.
  -p, --path PATH                 Output file or directory path. If an intended file path, it must have an ".mp3"
                                  suffix. If a directory, it must exist, and the file name is auto-determined. If not
                                  given, the output file is written to the current working directory with an auto-
                                  determined file name.
  -s, --max-sections INTEGER RANGE
                                  Maximum number of sections, between 3 and 100. If not given, it is unrestricted.
                                  [3<=x<=100]
  -m, --markers / -nm, --no-markers
                                  Include markers at the start or end of sections in the generated audio. If
                                  `--markers`, markers are included, and this is the default. If `--no-markers`,
                                  markers are excluded, as can be appropriate for foreign-language generation.
  -c, --confirm / -nc, --no-confirm
                                  Confirm before full-text and speech generation. If `--confirm`, a confirmation is
                                  interactively sought as each step of the workflow progresses, and this is the
                                  default. If `--no-confirm`, the full-text and speech are generated without
                                  confirmations.
  -h, --help                      Show this message and exit.

Exemples d'utilisation:

 $ python -m podgenai -t "My favorite topic"

$ python -m podgenai -t "My favorite topic" -p ~/Downloads/

$ python -m podgenai -t "My favorite topic" -p ~/Downloads/topic.mp3 -nc

$ python -m podgenai -t "L'histoire de Napoléon Bonaparte (français)" -nm

Utilisation comme bibliothèque

 >> > from podgenai import generate_media
>> > import inspect

>> > print ( inspect . signature ( generate_media ))
( topic : str , * , output_path : Optional [ pathlib . Path ] = None , max_sections : Optional [ int ] = None , markers : bool = True , confirm : bool = False ) - > pathlib . Path

>> > print ( inspect . getdoc ( generate_media ))

 Return the output path after generating and writing an audiobook podcast to file for the given topic.

Params:
* `topic`: Topic.
* `path`: Output file or directory path.
    If an intended file path, it must have an ".mp3" suffix. If a directory, it must exist, and the file name is auto-determined.
    If not given, the output file is written to the repo directory with an auto-determined file name.
* `max_sections`: Maximum number of sections to generate. It is between 3 and 100. It is unrestricted if not given.
* `markers`: Include markers at the start or end of sections in the generated audio.
    If true, markers are included. If false, markers are excluded, as can be appropriate for foreign-language generation. Its default is true.
* `confirm`: Confirm before full-text and speech generation.
    If true, a confirmation is interactively sought after generating and printing the list of subtopics, before generating the full-text, and also before generating the speech. Its default is false.

If failed, a subclass of the `podgenai.exceptions.Error` exception is raised.

Cache

Les segments de texte et de discours sont mis en cache localement sur le disque dans le répertoire ./work/<topic> . Ils peuvent être supprimés manuellement. Cette suppression n'est actuellement pas automatique. De plus, il peut actuellement être nécessaire de supprimer un ou plusieurs fichiers mis en cache applicables si le cache doit être contourné.

Clause de non-responsabilité

_{Ce logiciel est fourni "tel quel", sans garantie d'aucune sorte, express ou implicite, y compris, mais sans s'y limiter, les garanties de qualité marchande, d'adéquation à un usage particulier et de non-contrefaçon. En aucun cas, les auteurs ou les titulaires de droits d'auteur ne seront pas responsables de toute réclamation, dommage ou autre responsabilité, que ce soit dans une action de contrat, de délit ou autre, découlant de, ou en relation avec le logiciel ou l'utilisation ou d'autres transactions dans le logiciel.}

_{Les utilisateurs doivent être conscients que le texte et l'audio des fichiers générés sont produits par l'intelligence artificielle (AI) en fonction des entrées données et des données disponibles pour le modèle d'IA au moment de la génération. En tant que tels, des inexactitudes, des erreurs ou un contenu involontaire peuvent se produire. Il est conseillé aux utilisateurs de faire preuve de prudence et de vérifier l'exactitude et la pertinence du contenu généré avant toute utilisation ou recours.}

_{Vous êtes responsable des coûts associés à l'utilisation de l'API OpenAI, comme l'exige le logiciel, et vous devez vous conformer aux conditions d'utilisation de l'API OpenAI. La fonctionnalité du logiciel dépend de la disponibilité et des fonctionnalités des services et logiciels externes, y compris, mais sans s'y limiter, l'API OpenAI et FFMPEG, sur lesquelles les auteurs n'ont aucun contrôle.}

_{L'utilisation de la clé API OpenAI et de tout contenu généré doit être conforme à toutes les lois et réglementations applicables, y compris les lois sur le droit d'auteur et les conditions d'utilisation de la plate-forme OpenAI. Vous êtes seul responsable de vous assurer que votre utilisation du logiciel et de tout contenu généré est conforme aux conditions d'utilisation OpenAI et à toute autre lois et réglementations applicables.}

_{Ce logiciel est sous licence en vertu de la licence GNU Unser General Public (LGPL), qui permet une utilisation, une modification et une distribution privées et commerciales, sous réserve des termes et conditions énoncés dans le LGPL. Vous auriez dû recevoir une copie de la licence publique GNU Unser-General avec ce programme. Sinon, voir http://www.gnu.org/licenses/.}

_{Les auteurs ne réclament pas la propriété d'aucun contenu généré à l'aide de ce logiciel. La responsabilité de l'utilisation de tout contenu généré repose avec l'utilisateur. Les utilisateurs doivent faire preuve de prudence et de diligence raisonnable pour garantir que le contenu généré n'encourage pas les droits des tiers.}

_{Cet avertissement est sujet à changement sans préavis. Il est de votre responsabilité de le revoir périodiquement pour les mises à jour.}

Développer

Informations supplémentaires

Version 0.8.0
Type Autre code source
Date de mise à jour 2025-03-01
taille 40.67KB
Provenant de Github

Applications connexes

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0

Actualités connexes Tout