podcastfy下载podcastfy源代码下载

podcastfy

其他源码

v0.4.0

下载

podcastfy.ai ？？？

Notebooklm的播客功能的开源API替代方案：将多模式内容转换为吸引使用Genai的多语言音频对话

podcastfy.mp4

纸| Python软件包|克利| REST API | Web应用程序|反馈

PodcastFy是一个开源Python软件包，将多模式内容（文本，图像）转换为使用Genai的引人入胜的多语音音频对话。输入内容包括网站，PDF，图像，YouTube视频以及用户提供的主题。

与主要关注研究综合的封闭源UI工具（例如NotebookLM❤️）不同，PodcastFy专注于开源，程序化和定制生成的引人入胜的，来自多种模式源的引人入胜的对话内容，启用自定义和规模。

音频示例？

使用此Python笔记本生成了此样本集。

图像

样本1：Senecio，1922年（Paul Klee）和文明的联系（2017年），Gheorghe Virtosu

塞内西奥，1922年（保罗·克莱） Gheorghe Virtosu的文明联系（2017年）

senecio.mp4

样本2：1831年（北川）和塔基亚莎（Takiyasha）和巫婆幽灵（skeleton Specter）的大浪潮（The Kanagawa），c。 1844年（Kuniyoshi）

1831年（北川）的大浪潮（Kanagawa）塔基亚莎（Takiyasha）女巫和骨骼幽灵，c。 1844年（Kuniyoshi）

Japan.mp4

样本3：流行文化偶像泰勒·斯威夫特和莫娜·丽莎，1503年（莱昂纳多da vinci）

泰勒·斯威夫特蒙娜丽莎

Taylor.mp4

文本

声音的	描述	来源
souza.mp4	个人网站	网站
音频（ `longform=True` ）	Lex Fridman播客：5H采访Dario Amodei人类首席执行官	YouTube
音频（ `longform=True` ）	本杰明·富兰克林的自传	书

多语言文本

语言	内容类型	描述	声音的	来源
法语	网站	农业气候研究信息	声音的	网站
葡萄牙-BR	新闻文章	圣保罗的选举民意测验	声音的	网站

Quickstart

先决条件

Python 3.11或更高
$ pip install ffmpeg （用于音频处理）

设置

从pypi $ pip install podcastfy
设置您的API键

Python

 from podcastfy . client import generate_podcast

audio_file = generate_podcast ( urls = [ "<url1>" , "<url2>" ])

CLI

 python -m podcastfy.client --url <url1> --url <url2>

用法

Python软件包Quickstart
如何
Python包装参考手册
REST API参考手册
CLI

定制？

PodcastFY提供了一系列自定义选项，以调整您的AI生成的播客：

自定义播客对话（例如格式，样式，声音）
选择运行本地LLM（156个拥抱面模型）
设置其他配置设置

特征

从多种来源和格式（图像，文本，网站，YouTube和PDF）生成对话内容。
生成短裤（2-5分钟）或longform（30多分钟）播客。
自定义成绩单和音频生成（例如样式，语言，结构）。
使用100+ LLM型号（OpenAI，Anthropic，Google等）生成笔录。
利用本地LLM进行成绩单生成，以增加隐私和控制。
与高级文本到语音模型（OpenAI，Google，Elevenlabs和Microsoft Edge）集成。
为全球内容创建提供多语言支持。
与CLI和Python软件包无缝集成以进行自动工作流程。

由PodcastFy建造

OpenNTOTEBOOK
冲浪
OpenPod
播客-LLM
PodcastFy-HuggingFace应用程序

更新

V0.4.0+发布

发布了新的多演讲者TTS模型（这是NotebookLM使用的吗？！？）
生成简短或长形播客
使用接地的实时网络搜索从输入主题中生成播客
与100+ LLM型号（OpenAI，Anthropic，Google等）集成到成绩单生成

有关更多详细信息，请参见ChangElog。

执照

该软件已在Apache 2.0下许可。如果您想在软件中使用PodcastFy，请参见说明。

贡献？

我们欢迎捐款！有关更多详细信息，请参见指南。

示例用例？

内容创建者可以使用Podcastfy将博客文章，文章或多媒体内容转换为播客风格的音频，从而使他们能够吸引更广泛的受众。通过将内容转换为音频格式，创建者可以迎合喜欢聆听而不是阅读的用户。
教育工作者可以将讲义，演示文稿和视觉材料转换为音频对话，从而使教育内容更容易获得不同学习偏好的学生。这对于视觉障碍或难以处理书面信息的学生特别有益。
研究人员可以将研究论文，视觉数据和技术内容转换为对话音频。这使得包括残疾人在内的更广泛的受众更容易消费和理解复杂的科学信息。研究人员还可以创建其工作的音频摘要，以增强可访问性。
可访问性倡导者可以通过提供将多模式内容转换为听觉格式的工具来使用Podcastfy来促进数字可访问性。这可以帮助患有视觉障碍，阅读障碍或其他残疾的人，这些残障人士挑战书面或视觉内容。

贡献者

↑回到顶部↑

展开

附加信息

版本 v0.4.0
类型其他源码
更新时间 2025-02-28
大小 135MB
来自于 Github

podcastfy

podcastfy.ai ？？？

音频示例？

图像

文本

多语言文本

Quickstart

先决条件

设置

Python

CLI

用法

定制？

特征

推荐

由PodcastFy建造

更新

V0.4.0+发布

执照

贡献？

示例用例？

贡献者

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf