Notebooklm的播客功能的開源API替代方案:將多模式內容轉換為吸引使用Genai的多語言音頻對話
紙| Python軟件包|克利| REST API | Web應用程序|回饋
PodcastFy是一個開源Python軟件包,將多模式內容(文本,圖像)轉換為使用Genai的引人入勝的多語音音頻對話。輸入內容包括網站,PDF,圖像,YouTube視頻以及用戶提供的主題。
與主要關注研究綜合的封閉源UI工具(例如NotebookLM❤️)不同,PodcastFy專注於開源,程序化和定制生成的引人入勝的,來自多種模式源的引人入勝的對話內容,啟用自定義和規模。
使用此Python筆記本生成了此樣本集。
樣本1:Senecio,1922年(Paul Klee)和文明的聯繫(2017年),Gheorghe Virtosu


樣本2:1831年(北川)和塔基亞莎(Takiyasha)和巫婆幽靈(skeleton Specter)的大浪潮(The Kanagawa),c。 1844年(Kuniyoshi)


樣本3:流行文化偶像泰勒·斯威夫特和莫娜·麗莎,1503年(萊昂納多da vinci)


| 聲音的 | 描述 | 來源 |
|---|---|---|
souza.mp4 | 個人網站 | 網站 |
音頻( longform=True ) | Lex Fridman播客:5H採訪Dario Amodei人類首席執行官 | Youtube |
音頻( longform=True ) | 本傑明·富蘭克林的自傳 | 書 |
| 語言 | 內容類型 | 描述 | 聲音的 | 來源 |
|---|---|---|---|---|
| 法語 | 網站 | 農業氣候研究信息 | 聲音的 | 網站 |
| 葡萄牙-BR | 新聞文章 | 聖保羅的選舉民意測驗 | 聲音的 | 網站 |
$ pip install ffmpeg (用於音頻處理)從pypi $ pip install podcastfy
設置您的API鍵
from podcastfy . client import generate_podcast
audio_file = generate_podcast ( urls = [ "<url1>" , "<url2>" ]) python -m podcastfy.client --url <url1> --url <url2>
Python軟件包Quickstart
如何
Python包裝參考手冊
REST API參考手冊
CLI
PodcastFY提供了一系列自定義選項,以調整您的AI生成的播客:
“喜歡這項倡議,這是我到目前為止所看到的最好的,特別是對於'非技術'用戶而言。”
“愛您隨便建造了過去十年中最受歡迎的Google最受歡迎的產品的開源版””
“您的圖書館很簡單。您做了很棒的工作兄弟”
“我認為您受到啟發/認識到擊敗筆記本電信的質量有多難,但是您對此做了不可思議的工作!聽起來令人難以置信,而且是開源的!謝謝您的驚人!”
有關更多詳細信息,請參見ChangElog。
該軟件已在Apache 2.0下許可。如果您想在軟件中使用PodcastFy,請參見說明。
我們歡迎捐款!有關更多詳細信息,請參見指南。
內容創建者可以使用Podcastfy將博客文章,文章或多媒體內容轉換為播客風格的音頻,從而使他們能夠吸引更廣泛的受眾。通過將內容轉換為音頻格式,創建者可以迎合喜歡聆聽而不是閱讀的用戶。
教育工作者可以將講義,演示文稿和視覺材料轉換為音頻對話,從而使教育內容更容易獲得不同學習偏好的學生。這對於視覺障礙或難以處理書面信息的學生特別有益。
研究人員可以將研究論文,視覺數據和技術內容轉換為對話音頻。這使得包括殘疾人在內的更廣泛的受眾更容易消費和理解複雜的科學信息。研究人員還可以創建其工作的音頻摘要,以增強可訪問性。
可訪問性倡導者可以通過提供將多模式內容轉換為聽覺格式的工具來使用Podcastfy來促進數字可訪問性。這可以幫助患有視覺障礙,閱讀障礙或其他殘疾的人,這些殘障人士挑戰書面或視覺內容。
↑回到頂部↑