노트북의 팟 캐스트 기능에 대한 오픈 소스 API 대안 : Genai와의 다국적 오디오 대화로 멀티 모달 컨텐츠를 변환
종이 | 파이썬 패키지 | cli | REST API | 웹 앱 | 피드백
PodcastFy는 오픈 소스 파이썬 패키지로, 멀티 모달 컨텐츠 (텍스트, 이미지)를 Genai를 사용하여 다재다능한 오디오 대화로 변환합니다. 입력 콘텐츠에는 웹 사이트, PDF, 이미지, YouTube 비디오 및 사용자 제공 주제가 포함됩니다.
PodcastFy는 주로 연구 합성 (예 : Notebooklm ❤️)에 중점을 둔 폐쇄 소스 UI 기반 도구와 달리, 오픈 소스, 프로그래밍 방식 및 맞춤형 대화, 대화 내용의 수많은 다중 모전 소스에서 문의 및 규모를 가능하게하는 데 중점을 둡니다.
이 샘플 컬렉션은이 Python 노트북을 사용하여 생성되었습니다.
샘플 1 : Senecio, 1922 (Paul Klee) 및 문명의 연결 (2017)의 Gheorghe Virtosu


샘플 2 : 1831 년 카나가와 (Hokusai)와 타키야샤 마녀와 골격 스펙터, c. 1844 (kuniyoshi)


샘플 3 : 대중 문화 아이콘 Taylor Swift와 Mona Lisa, 1503 (Leonardo da Vinci)


| 오디오 | 설명 | 원천 |
|---|---|---|
souza.mp4 | 개인 웹 사이트 | 웹 사이트 |
오디오 ( longform=True ) | Lex Fridman Podcast : 5H Dario Amodei Anthropic의 CEO와의 인터뷰 | YouTube |
오디오 ( longform=True ) | 벤자민 프랭클린의 자서전 | 책 |
| 언어 | 컨텐츠 유형 | 설명 | 오디오 | 원천 |
|---|---|---|---|---|
| 프랑스 국민 | 웹 사이트 | 농산물 연구 정보 | 오디오 | 웹 사이트 |
| 포르투갈어 브 | 뉴스 기사 | 상파울루에서 선거 여론 조사 | 오디오 | 웹 사이트 |
$ pip install ffmpeg (오디오 처리 용) pypi $ pip install podcastfy
API 키를 설정하십시오
from podcastfy . client import generate_podcast
audio_file = generate_podcast ( urls = [ "<url1>" , "<url2>" ]) python -m podcastfy.client --url <url1> --url <url2>
파이썬 패키지 QuickStart
방법
파이썬 패키지 참조 매뉴얼
API 참조 매뉴얼을 휴식하십시오
클리
PodcastFy는 AI 생성 팟 캐스트를 조정하기위한 다양한 사용자 정의 옵션을 제공합니다.
"이 이니셔티브와 내가 지금까지 본 이니셔티브를 사랑한다.
"지난 10 년 동안 구축 된 가장 인기있는 제품의 오픈 소스 버전을 우연히 만들었습니다."
"당신의 도서관은 함께 일하기가 매우 간단했습니다. 당신은 놀라운 일을했습니다."
"노트북의 품질을이기는 것이 얼마나 어려운지 영감을 얻은 것이 굉장하다고 생각하지만, 당신은 이것으로 놀라운 일을했습니다! 그것은 놀라운 소리와 오픈 소스입니다! 놀랍게도 감사합니다!"
자세한 내용은 ChangElog를 참조하십시오.
이 소프트웨어는 Apache 2.0에 따라 라이센스가 부여됩니다. 소프트웨어에서 PodcastFy를 사용하려는 경우 지침을 참조하십시오.
우리는 기여를 환영합니다! 자세한 내용은 지침을 참조하십시오.
Content Creator는 Podcastfy 사용하여 블로그 게시물, 기사 또는 멀티미디어 컨텐츠를 Podcast 스타일 오디오로 변환하여 광범위한 잠재 고객에게 도달 할 수 있습니다. 컨텐츠를 오디오 형식으로 변환함으로써 제작자는 읽기를 듣는 것을 선호하는 사용자에게 수용 할 수 있습니다.
교육자들은 강의 노트, 프레젠테이션 및 시각 자료를 오디오 대화로 변환 할 수있어 학습 선호도가 다른 학생들이 교육 콘텐츠를보다 쉽게 이용할 수 있습니다. 이것은 시각 장애가있는 학생들이나 서면 정보를 처리하기가 어려운 학생들에게 특히 유익합니다.
연구원들은 연구 논문, 시각 데이터 및 기술 컨텐츠를 대화 오디오로 변환 할 수 있습니다. 이를 통해 장애가있는 사람들을 포함하여 더 많은 청중이 복잡한 과학 정보를 소비하고 이해하기가 더 쉬워집니다. 연구원들은 또한 접근성을 향상시키기 위해 자신의 작업에 대한 오디오 요약을 만들 수 있습니다.
접근성 옹호자들은 Podcastfy 사용하여 멀티 모드 컨텐츠를 청각 형식으로 변환하는 도구를 제공하여 디지털 접근성을 홍보 할 수 있습니다. 이를 통해 시각 장애, 난독증 또는 기타 장애가있는 개인은 서면 또는 시각적 콘텐츠를 소비하기가 어렵습니다.
↑ 위로 돌아갑니다 ↑