Notebooklm的播客功能的开源API替代方案:将多模式内容转换为吸引使用Genai的多语言音频对话
纸| Python软件包|克利| REST API | Web应用程序|反馈
PodcastFy是一个开源Python软件包,将多模式内容(文本,图像)转换为使用Genai的引人入胜的多语音音频对话。输入内容包括网站,PDF,图像,YouTube视频以及用户提供的主题。
与主要关注研究综合的封闭源UI工具(例如NotebookLM❤️)不同,PodcastFy专注于开源,程序化和定制生成的引人入胜的,来自多种模式源的引人入胜的对话内容,启用自定义和规模。
使用此Python笔记本生成了此样本集。
样本1:Senecio,1922年(Paul Klee)和文明的联系(2017年),Gheorghe Virtosu


样本2:1831年(北川)和塔基亚莎(Takiyasha)和巫婆幽灵(skeleton Specter)的大浪潮(The Kanagawa),c。 1844年(Kuniyoshi)


样本3:流行文化偶像泰勒·斯威夫特和莫娜·丽莎,1503年(莱昂纳多da vinci)


| 声音的 | 描述 | 来源 |
|---|---|---|
souza.mp4 | 个人网站 | 网站 |
音频( longform=True ) | Lex Fridman播客:5H采访Dario Amodei人类首席执行官 | YouTube |
音频( longform=True ) | 本杰明·富兰克林的自传 | 书 |
| 语言 | 内容类型 | 描述 | 声音的 | 来源 |
|---|---|---|---|---|
| 法语 | 网站 | 农业气候研究信息 | 声音的 | 网站 |
| 葡萄牙-BR | 新闻文章 | 圣保罗的选举民意测验 | 声音的 | 网站 |
$ pip install ffmpeg (用于音频处理)从pypi $ pip install podcastfy
设置您的API键
from podcastfy . client import generate_podcast
audio_file = generate_podcast ( urls = [ "<url1>" , "<url2>" ]) python -m podcastfy.client --url <url1> --url <url2>
Python软件包Quickstart
如何
Python包装参考手册
REST API参考手册
CLI
PodcastFY提供了一系列自定义选项,以调整您的AI生成的播客:
“喜欢这项倡议,这是我到目前为止所看到的最好的,特别是对于'非技术'用户而言。”
“爱您随便建造了过去十年中最受欢迎的Google最受欢迎的产品的开源版””
“您的图书馆很简单。您做了很棒的工作兄弟”
“我认为您受到启发/认识到击败笔记本电信的质量有多难,但是您对此做了不可思议的工作!听起来令人难以置信,而且是开源的!谢谢您的惊人!”
有关更多详细信息,请参见ChangElog。
该软件已在Apache 2.0下许可。如果您想在软件中使用PodcastFy,请参见说明。
我们欢迎捐款!有关更多详细信息,请参见指南。
内容创建者可以使用Podcastfy将博客文章,文章或多媒体内容转换为播客风格的音频,从而使他们能够吸引更广泛的受众。通过将内容转换为音频格式,创建者可以迎合喜欢聆听而不是阅读的用户。
教育工作者可以将讲义,演示文稿和视觉材料转换为音频对话,从而使教育内容更容易获得不同学习偏好的学生。这对于视觉障碍或难以处理书面信息的学生特别有益。
研究人员可以将研究论文,视觉数据和技术内容转换为对话音频。这使得包括残疾人在内的更广泛的受众更容易消费和理解复杂的科学信息。研究人员还可以创建其工作的音频摘要,以增强可访问性。
可访问性倡导者可以通过提供将多模式内容转换为听觉格式的工具来使用Podcastfy来促进数字可访问性。这可以帮助患有视觉障碍,阅读障碍或其他残疾的人,这些残障人士挑战书面或视觉内容。
↑回到顶部↑