podcastfy 다운로드 - podcastfy 소스 코드 다운로드

podcastfy

기타 소스코드

v0.4.0

다운로드

podcastfy.ai? ️?

노트북의 팟 캐스트 기능에 대한 오픈 소스 API 대안 : Genai와의 다국적 오디오 대화로 멀티 모달 컨텐츠를 변환

podcastfy.mp4

종이 | 파이썬 패키지 | cli | REST API | 웹 앱 | 피드백

PodcastFy는 오픈 소스 파이썬 패키지로, 멀티 모달 컨텐츠 (텍스트, 이미지)를 Genai를 사용하여 다재다능한 오디오 대화로 변환합니다. 입력 콘텐츠에는 웹 사이트, PDF, 이미지, YouTube 비디오 및 사용자 제공 주제가 포함됩니다.

PodcastFy는 주로 연구 합성 (예 : Notebooklm ❤️)에 중점을 둔 폐쇄 소스 UI 기반 도구와 달리, 오픈 소스, 프로그래밍 방식 및 맞춤형 대화, 대화 내용의 수많은 다중 모전 소스에서 문의 및 규모를 가능하게하는 데 중점을 둡니다.

오디오 예?

이 샘플 컬렉션은이 Python 노트북을 사용하여 생성되었습니다.

이미지

샘플 1 : Senecio, 1922 (Paul Klee) 및 문명의 연결 (2017)의 Gheorghe Virtosu

Senecio, 1922 (Paul Klee) Gheorghe Virtosu의 문명의 연결 (2017)

Senecio.mp4

샘플 2 : 1831 년 카나가와 (Hokusai)와 타키야샤 마녀와 골격 스펙터, c. 1844 (kuniyoshi)

1831 년 카나가와의 큰 파도 (Hokusai) Takiyasha 마녀와 해골 스펙터, c. 1844 (kuniyoshi)

일본 .mp4

샘플 3 : 대중 문화 아이콘 Taylor Swift와 Mona Lisa, 1503 (Leonardo da Vinci)

테일러 스위프트 모나 리사

Taylor.mp4

텍스트

오디오	설명	원천
souza.mp4	개인 웹 사이트	웹 사이트
오디오 ( `longform=True` )	Lex Fridman Podcast : 5H Dario Amodei Anthropic의 CEO와의 인터뷰	YouTube
오디오 ( `longform=True` )	벤자민 프랭클린의 자서전	책

다국어 텍스트

언어	컨텐츠 유형	설명	오디오	원천
프랑스 국민	웹 사이트	농산물 연구 정보	오디오	웹 사이트
포르투갈어 브	뉴스 기사	상파울루에서 선거 여론 조사	오디오	웹 사이트

QuickStart

전제 조건

파이썬 3.11 이상
$ pip install ffmpeg (오디오 처리 용)

설정

pypi $ pip install podcastfy
API 키를 설정하십시오

파이썬

 from podcastfy . client import generate_podcast

audio_file = generate_podcast ( urls = [ "<url1>" , "<url2>" ])

클리

 python -m podcastfy.client --url <url1> --url <url2>

용법

파이썬 패키지 QuickStart
방법
파이썬 패키지 참조 매뉴얼
API 참조 매뉴얼을 휴식하십시오
클리

사용자 정의?

PodcastFy는 AI 생성 팟 캐스트를 조정하기위한 다양한 사용자 정의 옵션을 제공합니다.

팟 캐스트 대화 사용자 정의 (예 : 형식, 스타일, 음성)
로컬 LLMS (156+ huggingface 모델)를 실행하도록 선택하십시오.
다른 구성 설정을 설정하십시오

특징

여러 소스 및 형식 (이미지, 텍스트, 웹 사이트, YouTube 및 PDF)에서 대화 내용을 생성합니다.
반바지 (2-5 분) 또는 Longform (30 분) 팟 캐스트를 생성합니다.
전사 및 오디오 생성을 사용자 정의하십시오 (예 : 스타일, 언어, 구조).
100 개 이상의 LLM 모델 (OpenAi, Anthropic, Google 등)을 사용하여 전 사체를 생성합니다.
개인 정보 보호 및 제어 증가를 위해 전사 생성을 위해 로컬 LLM을 활용하십시오.
고급 텍스트 음성 연사 모델 (OpenAi, Google, ElevenLabs 및 Microsoft Edge)과 통합하십시오.
글로벌 컨텐츠 제작에 대한 다국적 지원을 제공합니다.
자동화 된 워크 플로우를 위해 CLI 및 Python 패키지와 완벽하게 통합하십시오.

증언

"이 이니셔티브와 내가 지금까지 본 이니셔티브를 사랑한다.

"지난 10 년 동안 구축 된 가장 인기있는 제품의 오픈 소스 버전을 우연히 만들었습니다."

"당신의 도서관은 함께 일하기가 매우 간단했습니다. 당신은 놀라운 일을했습니다."

"노트북의 품질을이기는 것이 얼마나 어려운지 영감을 얻은 것이 굉장하다고 생각하지만, 당신은 이것으로 놀라운 일을했습니다! 그것은 놀라운 소리와 오픈 소스입니다! 놀랍게도 감사합니다!"

podcastfy로 제작되었습니다

OpenNotebook
서핑 센스
OpenPod
팟 캐스트 -llm
podcastfy huggingface 앱

업데이트

v0.4.0+ 릴리스

새로운 멀티 스피커 TTS 모델 (노트북이 사용하는 하나입니까?!?)
짧거나 긴 형식 팟 캐스트를 생성합니다
접지 실시간 웹 검색을 사용하여 입력 주제에서 팟 캐스트 생성
전사 생성을위한 100 개 이상의 LLM 모델 (OpenAi, Anthropic, Google 등)과 통합

자세한 내용은 ChangElog를 참조하십시오.

특허

이 소프트웨어는 Apache 2.0에 따라 라이센스가 부여됩니다. 소프트웨어에서 PodcastFy를 사용하려는 경우 지침을 참조하십시오.

기여?

우리는 기여를 환영합니다! 자세한 내용은 지침을 참조하십시오.

예제 사용 사례?

Content Creator는 Podcastfy 사용하여 블로그 게시물, 기사 또는 멀티미디어 컨텐츠를 Podcast 스타일 오디오로 변환하여 광범위한 잠재 고객에게 도달 할 수 있습니다. 컨텐츠를 오디오 형식으로 변환함으로써 제작자는 읽기를 듣는 것을 선호하는 사용자에게 수용 할 수 있습니다.
교육자들은 강의 노트, 프레젠테이션 및 시각 자료를 오디오 대화로 변환 할 수있어 학습 선호도가 다른 학생들이 교육 콘텐츠를보다 쉽게 이용할 수 있습니다. 이것은 시각 장애가있는 학생들이나 서면 정보를 처리하기가 어려운 학생들에게 특히 유익합니다.
연구원들은 연구 논문, 시각 데이터 및 기술 컨텐츠를 대화 오디오로 변환 할 수 있습니다. 이를 통해 장애가있는 사람들을 포함하여 더 많은 청중이 복잡한 과학 정보를 소비하고 이해하기가 더 쉬워집니다. 연구원들은 또한 접근성을 향상시키기 위해 자신의 작업에 대한 오디오 요약을 만들 수 있습니다.
접근성 옹호자들은 Podcastfy 사용하여 멀티 모드 컨텐츠를 청각 형식으로 변환하는 도구를 제공하여 디지털 접근성을 홍보 할 수 있습니다. 이를 통해 시각 장애, 난독증 또는 기타 장애가있는 개인은 서면 또는 시각적 콘텐츠를 소비하기가 어렵습니다.

기고자

↑ 위로 돌아갑니다 ↑

확장하다

추가 정보

버전 v0.4.0
유형 기타 소스코드
업데이트 시간 2025-02-28
크기 135MB
출처 Github

podcastfy

podcastfy.ai? ️?

오디오 예?

이미지

텍스트

다국어 텍스트

QuickStart

전제 조건

설정

파이썬

클리

용법

사용자 정의?

특징

증언

podcastfy로 제작되었습니다

업데이트

v0.4.0+ 릴리스

특허

기여?

예제 사용 사례?

기고자

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf