podgenai 다운로드 podgenai 소스 코드 다운로드

podgenai

기타 소스코드

0.8.0

다운로드

포드게나이

Podgenai는 GPT-4 LLM을 사용하여 주어진 주제에 대한 정보 단일 스피커 오디오 북/팟 캐스트 MP3 파일을 생성하기위한 Python 3.12 응용 프로그램입니다. 생성 된 파일의 목표 지속 시간은 1 시간이지만 생성 된 지속 시간은 다양합니다. 자금 지원 OpenAI API 키가 필요합니다.

모래밭

표제	링크
레포	https://github.com/impredicative/podgenai
changelog	https://github.com/impredicative/podgenai/releases
패키지	https://pypi.org/project/podgenai
팟 캐스트	https://podcasters.spotify.com/pod/podgenai
팟 캐스트 RSS	https://anchor.fm/s/f4868644/podcast/rss

접근하다

gpt-4o 및 tts-1 모델이 사용됩니다. 주어진 주제의 경우, 높은 수준의 참조 접근법은 다음과 같습니다.

적용 가능한 하위 주제는 LLM을 사용하여 나열됩니다. 그러나 주제가 LLM에 알려지지 않은 경우 프로세스가 중단됩니다.
음성은 4 가지 선택에서 LLM을 사용하여 선택됩니다.
각 하위 주제에 대해 동시에, 해당 텍스트 및 음성은 각각 LLM 및 TTS를 사용하여 생성됩니다.
음성 파일은 ffmpeg 사용하여 연결됩니다.

때때로 아층 학적으로 내용의 의미 론적 반복이있을 수 있지만,이 중요한 요점의 반복이 학습과 암기에 도움이 될 수 있기 때문에 의도적으로 "최적화"되지 않았습니다. 특정 하위 주제에 대해 더 깊이 뛰어 들기 위해서는 새 파일을 만들려고 시도 할 수 있습니다.

샘플

이 생성 된 MP3 파일은 다운로드 할 수 있습니다. 사실상, 이들은 또한 각 샘플의 고유 한 목적으로 최소 수동 테스트 스위트를 구성합니다. 알림으로, 음성은 LLM에 의해 선택됩니다.

추가 주제에 대한 에피소드가 시간이 지남에 따라 수동으로 게시 될 수있는 관련 팟 캐스트 (RSS)도 있습니다.

비 기술적 주제에는 1.05x, 기술 주제의 경우 1.0x, 외국어 주제의 경우 0.95 배의 재생 속도가 권장됩니다.

목소리	이름	목적
기본	Pytorch	기술 콘텐츠 생성
기본	고급 파이토치	고급 기술 컨텐츠 생성
기본	소프트웨어 엔지니어 면접 팁	기본 음성 선택
감정	뉴욕시 : 현재와 미래	비 기술적 컨텐츠 생성
감정	좋은 삶을 사는 것	감동적인 음성 선택
기본	인공 일반 지능 (AGI) : 접근 및 알고리즘	비 계층 평평한 단일 레벨 하위 주변 목록 시행
여성	인간 순환계 (abridged)	비 변환되지 않은 접미사에 대한 암시 적 주제 지원
여성	버피 뱀파이어 슬레이어	여성 음성 선택
남성	얼간이를위한 비트 코인	남성 음성 선택

설정

일반적인 설정

작업 디렉토리에서 의도 된 환경 변수 OPENAI_API_KEY=<your OpenAI API key> 있는 .env 라는 파일을 작성하거나 다른 방식으로 설정하십시오.
선택적으로 환경 변수를 더 빠른 생성에 대해서는 환경 변수 PODGENAI_OPENAI_MAX_WORKERS=32 설정하고 기본값은 16입니다.
ffmpeg 사용할 수 있는지 확인하십시오. 포함 된 DevContainer 정의를 사용하는 경우 자동입니다.
아래와 같이 GitHub 또는 PYPI를 통해 설정을 계속하십시오.

DevContainer를 사용하여 GitHub를 통한 설정

일반적인 설정 단계에서 계속하십시오.
이 저장소를 복제하거나 다운로드하십시오.
정의 된 DevContainer를 구축하고 제공하십시오.

GitHub를 통해 수동으로 설정합니다

일반적인 설정 단계에서 계속하십시오.
이 저장소를 복제하거나 다운로드하십시오.
rye 설치되어 사용 가능한지 확인하십시오.
Repo 디렉토리에서 rye sync --no-lock 실행하십시오.

PYPI를 통한 설정

일반적인 설정 단계에서 계속하십시오.
Python 3.12 DevContainer 또는 가상 환경을 생성하고 활성화하십시오.
PYPI : pip install -U podgenai 통해 설치하십시오.

용법

사용은 명령 줄 애플리케이션 또는 파이썬 라이브러리 일 수 있습니다. 기본적으로 생성 된 MP3 파일은 현재 작업 디렉토리에 기록됩니다. 2024 년 현재, 세대 당 일반적인 비용은 1 ~ 2 USD,보다 구체적으로 하위 주당 0.10 USD 미만입니다. 시간은 3 분 미만입니다.

사용 팁

요청 된 주제가 거절로 인해 하위 주제를 생성하지 못하면 여러 시도로 성공할 수 있으므로 몇 번 연락하십시오. 그렇지 않다면, 더 넓거나 좁거나 더 사실이되도록 다시 말해보십시오. 첫 번째 시도는 사용 가능한 경우 디스크 캐시를 재사용하지만 런마다 최대 두 번의 시도가 이루어집니다.
잠재적으로 더 긴 덮힌 하위 주제 목록의 경우, "(abridged)"접미사를 요청한 주제, 예를 들어 "pytorch (unabridged)"에 추가하십시오.
팟 캐스트가 시작될 때 주제를 사용하지 못하는 경우 ./work/<topic>/1.*.mp3 .mp3를 삭제하고 출력을 재생하십시오.
주제에 대한 커버 아트 이미지를 선택적으로 생성하려면이 사용자 정의 GPT를 사용할 수 있습니다.
외국어로 생성을 시도하려면 언어 이름의 괄호 안 접두사와 함께 원하는 언어로 제목을 지정하십시오. 세대가 처음 거부되면 다시 시도하십시오. 또한 --no-markers 옵션을 참조하고 사용하십시오.

응용 프로그램으로 사용됩니다

사용 도움말은 다음과 같습니다.

 $ python -m podgenai -h
Usage: python -m podgenai [OPTIONS]

  Generate and write an audiobook podcast mp3 file for the given topic to the given output file path.

Options:
  -t, --topic TEXT                Topic. If not given, the user is prompted for it.
  -p, --path PATH                 Output file or directory path. If an intended file path, it must have an ".mp3"
                                  suffix. If a directory, it must exist, and the file name is auto-determined. If not
                                  given, the output file is written to the current working directory with an auto-
                                  determined file name.
  -s, --max-sections INTEGER RANGE
                                  Maximum number of sections, between 3 and 100. If not given, it is unrestricted.
                                  [3<=x<=100]
  -m, --markers / -nm, --no-markers
                                  Include markers at the start or end of sections in the generated audio. If
                                  `--markers`, markers are included, and this is the default. If `--no-markers`,
                                  markers are excluded, as can be appropriate for foreign-language generation.
  -c, --confirm / -nc, --no-confirm
                                  Confirm before full-text and speech generation. If `--confirm`, a confirmation is
                                  interactively sought as each step of the workflow progresses, and this is the
                                  default. If `--no-confirm`, the full-text and speech are generated without
                                  confirmations.
  -h, --help                      Show this message and exit.

사용 예제 :

 $ python -m podgenai -t "My favorite topic"

$ python -m podgenai -t "My favorite topic" -p ~/Downloads/

$ python -m podgenai -t "My favorite topic" -p ~/Downloads/topic.mp3 -nc

$ python -m podgenai -t "L'histoire de Napoléon Bonaparte (français)" -nm

라이브러리로서 사용합니다

 >> > from podgenai import generate_media
>> > import inspect

>> > print ( inspect . signature ( generate_media ))
( topic : str , * , output_path : Optional [ pathlib . Path ] = None , max_sections : Optional [ int ] = None , markers : bool = True , confirm : bool = False ) - > pathlib . Path

>> > print ( inspect . getdoc ( generate_media ))

 Return the output path after generating and writing an audiobook podcast to file for the given topic.

Params:
* `topic`: Topic.
* `path`: Output file or directory path.
    If an intended file path, it must have an ".mp3" suffix. If a directory, it must exist, and the file name is auto-determined.
    If not given, the output file is written to the repo directory with an auto-determined file name.
* `max_sections`: Maximum number of sections to generate. It is between 3 and 100. It is unrestricted if not given.
* `markers`: Include markers at the start or end of sections in the generated audio.
    If true, markers are included. If false, markers are excluded, as can be appropriate for foreign-language generation. Its default is true.
* `confirm`: Confirm before full-text and speech generation.
    If true, a confirmation is interactively sought after generating and printing the list of subtopics, before generating the full-text, and also before generating the speech. Its default is false.

If failed, a subclass of the `podgenai.exceptions.Error` exception is raised.

은닉처

텍스트 및 음성 세그먼트는 ./work/<topic> 디렉토리의 디스크에 로컬로 캐시됩니다. 수동으로 삭제할 수 있습니다. 이 삭제는 현재 자동이 아닙니다. 또한 캐시를 우회하는 경우 적용 가능한 캐시 파일 하나 이상을 삭제해야 할 수도 있습니다.

부인 성명

_{사용자는 생성 된 파일의 텍스트와 오디오가 생성 시점에 주어진 입력 및 AI 모델에 사용할 수있는 데이터를 기반으로 인공 지능 (AI)에 의해 생성된다는 것을 알고 있어야합니다. 따라서 부정확성, 오류 또는 의도하지 않은 컨텐츠가 발생할 수 있습니다. 사용자는 사용 또는 의존 전에주의를 기울이고 생성 된 콘텐츠의 정확성과 적절성을 확인하는 것이 좋습니다.}

_{귀하는 소프트웨어가 요구하는 OpenAI API 사용과 관련된 비용에 대해 책임을지며 OpenAI API 서비스 약관을 준수해야합니다. 소프트웨어의 기능은 저자가 제어 할 수없는 OpenAI API 및 FFMPEG를 포함하되 이에 국한되지 않는 외부 서비스 및 소프트웨어의 가용성 및 기능에 따라 다릅니다.}

_{이 소프트웨어는 LGPL에 명시된 이용 약관에 따라 개인 및 상업용 사용, 수정 및 배포를 모두 허용하는 GNU Lesser General Public License (LGPL)에 따라 라이센스가 부여됩니다. 이 프로그램과 함께 GNU Lesser General Public License 사본을 받았어야합니다. 그렇지 않은 경우 http://www.gnu.org/licenses/를 참조하십시오.}

_{저자는이 소프트웨어를 사용하여 생성 된 컨텐츠의 소유권을 주장하지 않습니다. 생성 된 모든 콘텐츠 사용에 대한 책임은 사용자에게 달려 있습니다. 사용자는 생성 된 콘텐츠가 제 3 자의 권리를 침해하지 않도록주의와 실사를 수행해야합니다.}

_{이 면책 조항은 통지없이 변경 될 수 있습니다. 업데이트를 위해 정기적으로 검토하는 것은 귀하의 책임입니다.}

확장하다

추가 정보

버전 0.8.0
유형 기타 소스코드
업데이트 시간 2025-03-01
크기 40.67KB
출처 Github

podgenai

포드게나이

모래밭

접근하다

샘플

설정

일반적인 설정

DevContainer를 사용하여 GitHub를 통한 설정

GitHub를 통해 수동으로 설정합니다

PYPI를 통한 설정

용법

사용 팁

응용 프로그램으로 사용됩니다

라이브러리로서 사용합니다

은닉처

부인 성명

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf