podcastfy下載podcastfy源代碼下載

podcastfy

其他源碼

v0.4.0

下載

podcastfy.ai ？？？

Notebooklm的播客功能的開源API替代方案：將多模式內容轉換為吸引使用Genai的多語言音頻對話

podcastfy.mp4

紙| Python軟件包|克利| REST API | Web應用程序|回饋

PodcastFy是一個開源Python軟件包，將多模式內容（文本，圖像）轉換為使用Genai的引人入勝的多語音音頻對話。輸入內容包括網站，PDF，圖像，YouTube視頻以及用戶提供的主題。

與主要關注研究綜合的封閉源UI工具（例如NotebookLM❤️）不同，PodcastFy專注於開源，程序化和定制生成的引人入勝的，來自多種模式源的引人入勝的對話內容，啟用自定義和規模。

音頻示例？

使用此Python筆記本生成了此樣本集。

圖像

樣本1：Senecio，1922年（Paul Klee）和文明的聯繫（2017年），Gheorghe Virtosu

塞內西奧，1922年（保羅·克萊） Gheorghe Virtosu的文明聯繫（2017年）

senecio.mp4

樣本2：1831年（北川）和塔基亞莎（Takiyasha）和巫婆幽靈（skeleton Specter）的大浪潮（The Kanagawa），c。 1844年（Kuniyoshi）

1831年（北川）的大浪潮（Kanagawa）塔基亞莎（Takiyasha）女巫和骨骼幽靈，c。 1844年（Kuniyoshi）

Japan.mp4

樣本3：流行文化偶像泰勒·斯威夫特和莫娜·麗莎，1503年（萊昂納多da vinci）

泰勒·斯威夫特蒙娜麗莎

Taylor.mp4

文字

聲音的	描述	來源
souza.mp4	個人網站	網站
音頻（ `longform=True` ）	Lex Fridman播客：5H採訪Dario Amodei人類首席執行官	Youtube
音頻（ `longform=True` ）	本傑明·富蘭克林的自傳	書

多語言文本

語言	內容類型	描述	聲音的	來源
法語	網站	農業氣候研究信息	聲音的	網站
葡萄牙-BR	新聞文章	聖保羅的選舉民意測驗	聲音的	網站

Quickstart

先決條件

Python 3.11或更高
$ pip install ffmpeg （用於音頻處理）

設定

從pypi $ pip install podcastfy
設置您的API鍵

Python

 from podcastfy . client import generate_podcast

audio_file = generate_podcast ( urls = [ "<url1>" , "<url2>" ])

CLI

 python -m podcastfy.client --url <url1> --url <url2>

用法

Python軟件包Quickstart
如何
Python包裝參考手冊
REST API參考手冊
CLI

定制？

PodcastFY提供了一系列自定義選項，以調整您的AI生成的播客：

自定義播客對話（例如格式，樣式，聲音）
選擇運行本地LLM（156個擁抱面模型）
設置其他配置設置

特徵

從多種來源和格式（圖像，文本，網站，YouTube和PDF）生成對話內容。
生成短褲（2-5分鐘）或longform（30多分鐘）播客。
自定義成績單和音頻生成（例如樣式，語言，結構）。
使用100+ LLM型號（OpenAI，Anthropic，Google等）生成筆錄。
利用本地LLM進行成績單生成，以增加隱私和控制。
與高級文本到語音模型（OpenAI，Google，Elevenlabs和Microsoft Edge）集成。
為全球內容創建提供多語言支持。
與CLI和Python軟件包無縫集成以進行自動工作流程。

由PodcastFy建造

OpenNTOTEBOOK
衝浪
OpenPod
播客-LLM
PodcastFy-HuggingFace應用程序

更新

V0.4.0+發布

發布了新的多演講者TTS模型（這是NotebookLM使用的嗎？！？）
生成簡短或長形播客
使用接地的實時網絡搜索從輸入主題中生成播客
與100+ LLM型號（OpenAI，Anthropic，Google等）集成到成績單生成

有關更多詳細信息，請參見ChangElog。

執照

該軟件已在Apache 2.0下許可。如果您想在軟件中使用PodcastFy，請參見說明。

貢獻？

我們歡迎捐款！有關更多詳細信息，請參見指南。

示例用例？

內容創建者可以使用Podcastfy將博客文章，文章或多媒體內容轉換為播客風格的音頻，從而使他們能夠吸引更廣泛的受眾。通過將內容轉換為音頻格式，創建者可以迎合喜歡聆聽而不是閱讀的用戶。
教育工作者可以將講義，演示文稿和視覺材料轉換為音頻對話，從而使教育內容更容易獲得不同學習偏好的學生。這對於視覺障礙或難以處理書面信息的學生特別有益。
研究人員可以將研究論文，視覺數據和技術內容轉換為對話音頻。這使得包括殘疾人在內的更廣泛的受眾更容易消費和理解複雜的科學信息。研究人員還可以創建其工作的音頻摘要，以增強可訪問性。
可訪問性倡導者可以通過提供將多模式內容轉換為聽覺格式的工具來使用Podcastfy來促進數字可訪問性。這可以幫助患有視覺障礙，閱讀障礙或其他殘疾的人，這些殘障人士挑戰書面或視覺內容。

貢獻者

↑回到頂部↑

展開

附加信息

版本 v0.4.0
類型其他源碼
更新時間 2025-02-28
大小 135MB
來自於 Github

相關應用

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

爲您推薦

chat.petals.dev

其他源碼

1.0.0
GPT Prompt Templates

其他源碼

1.0.0
GPTyped

其他源碼

GPTyped 1.0.5
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

其他源碼

1.0.0
Google Dorks

其他源碼

1.0
shepherd

其他源碼

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

其他源碼

1.0.0

相關資訊全部