podcastfyダウンロードpodcastfyソースコードのダウンロード

podcastfy

その他のソースコード

v0.4.0

ダウンロード

podcastfy.ai？€？

Notebooklmのポッドキャスト機能に代わるオープンソースAPI機能：マルチモーダルコンテンツをGenaiとの魅惑的な多言語オーディオ会話に変換する

podcastfy.mp4

PodcastFyは、Genaiを使用したマルチモーダルコンテンツ（テキスト、画像）を魅力的な多言語の会話に変換するオープンソースPythonパッケージです。入力コンテンツには、Webサイト、PDF、画像、YouTubeビデオ、およびユーザーが提供するトピックが含まれます。

主に研究統合に焦点を当てたクローズドソースUIベースのツール（Notebooklm❤️）とは異なり、Podcastfyは、多数のマルチモーダルソースからのオープンソース、プログラム、および魅力的な会話コンテンツ、カスタマイズとスケールの有効化に焦点を当てています。

オーディオの例？

このサンプルコレクションは、このPythonノートブックを使用して生成されました。

画像

サンプル1：セネシオ、1922年（ポールクリー）と文明のつながり（2017）by Gheorghe Virtosu

セネシオ、1922年（ポール・クリー） Gheorghe Virtosuによる文明のつながり（2017）

senecio.mp4

サンプル2：カナガワ沖の大波、1831年（北野）と魔女の高山魔法とスケルトンスペクター、c。 1844年（クニヨシ）

1831年のカナガワ沖の大きな波（北野）魔女とスケルトンスペクターの高山、c。 1844年（クニヨシ）

Japan.mp4

サンプル3：ポップカルチャーのアイコンTaylor Swift and Mona Lisa、1503（Leonardo da Vinci）

テイラー・スウィフトモナリサ

Taylor.mp4

文章

オーディオ	説明	ソース
souza.mp4	個人的なウェブサイト	Webサイト
オーディオ（ `longform=True` ）	Lex Fridmanポッドキャスト：5H Dario Amodei AnthropicのCEOとのインタビュー	YouTube
オーディオ（ `longform=True` ）	ベンジャミン・フランクリンの自伝	本

多言語のテキスト

言語	コンテンツタイプ	説明	オーディオ	ソース
フランス語	Webサイト	農業研究情報	オーディオ	Webサイト
ポルトガル語-Br	ニュース記事	サンパウロでの選挙調査	オーディオ	Webサイト

クイックスタート

前提条件

Python 3.11以降
$ pip install ffmpeg （オーディオ処理用）

設定

pypi $ pip install podcastfy
APIキーをセットアップします

Python

 from podcastfy . client import generate_podcast

audio_file = generate_podcast ( urls = [ "<url1>" , "<url2>" ])

cli

 python -m podcastfy.client --url <url1> --url <url2>

使用法

Pythonパッケージクイックスタート
方法
Pythonパッケージリファレンスマニュアル
REST APIリファレンスマニュアル
cli

カスタマイズ？

PodcastFyは、AIに生成されたポッドキャストを調整するためのさまざまなカスタマイズオプションを提供しています。

ポッドキャストの会話をカスタマイズします（例：フォーマット、スタイル、声）
ローカルLLMSを実行することを選択します（156以上のハギングフェイスモデル）
他の構成設定を設定します

特徴

複数のソースと形式（画像、テキスト、Webサイト、YouTube、およびPDFS）から会話コンテンツを生成します。
ショーツ（2〜5分）またはロングフォーム（30分以上）ポッドキャストを生成します。
トランスクリプトとオーディオ生成（スタイル、言語、構造など）をカスタマイズします。
100以上のLLMモデル（Openai、人類、Googleなど）を使用して転写産物を生成します。
プライバシーと制御を増やすために、トランスクリプト生成にローカルLLMを活用します。
高度なテキストからスピーチモデル（Openai、Google、ElevenLabs、Microsoft Edge）と統合します。
グローバルコンテンツ作成に多言語サポートを提供します。
自動化されたワークフローのために、CLIおよびPythonパッケージとシームレスに統合します。

証言

「このイニシアチブと、これまでのところ、特に「非3番」のユーザーにとっては最高のものを愛しています。」

「過去10年間にGoogleが構築した最も人気のある製品のオープンソースバージョンを何気なく構築したのが大好きです」

「あなたの図書館は一緒に仕事をするのに非常に簡単でした。あなたは素晴らしい仕事の兄弟をしました」

「ノートブックルムの品質を打ち負かすのがどれほど難しいかを霊感を受けたり認識したりするのは素晴らしいことだと思いますが、あなたはこれで信じられないほどの仕事をしました！それは信じられないほど聞こえます、そしてそれはオープンソースです！素晴らしいことをありがとう！」

Podcastfyで構築されています

opennotebook
サーフセンス
OpenPod
ポッドキャスト-LLM
podcastfy-huggingfaceアプリ

更新

V0.4.0+リリース

新しいマルチスピーカーTTSモデルをリリースしました（Notebooklmが使用する1つのNoteBooklmですか？！？）
短いポッドキャストまたはロングフォームポッドキャストを生成します
接地されたリアルタイムWeb検索を使用して、入力トピックからポッドキャストを生成します
トランスクリプト生成のために、100以上のLLMモデル（Openai、人為的、Googleなど）と統合

詳細については、changelogを参照してください。

ライセンス

このソフトウェアは、Apache 2.0でライセンスされています。ソフトウェアでpodcastfyを使用する場合は、指示を参照してください。

貢献？

貢献を歓迎します！詳細については、ガイドラインを参照してください。

ユースケースの例？

コンテンツクリエーターは、 Podcastfyを使用してブログ投稿、記事、またはマルチメディアコンテンツをポッドキャストスタイルのオーディオに変換し、より幅広い視聴者にリーチできるようにすることができます。コンテンツをオーディオ形式に変換することにより、クリエイターは読書を聞くことを好むユーザーに応えることができます。
教育者は、講義ノート、プレゼンテーション、視覚資料をオーディオ会話に変換し、学習の好みを持つ学生が教育コンテンツをよりアクセスしやすくすることができます。これは、視覚障害のある学生や書面による情報の処理が困難な学生にとって特に有益です。
研究者は、研究論文、視覚データ、技術コンテンツを会話の音声に変換できます。これにより、障害のある人を含むより多くの聴衆が複雑な科学情報を消費して理解しやすくなります。研究者は、アクセシビリティを強化するために、作業の音声概要を作成することもできます。
アクセシビリティの支持者は、マルチモーダルコンテンツを聴覚形式に変換するツールを提供することにより、 Podcastfy使用してデジタルアクセシビリティを促進できます。これは、視覚障害、ディスレクシア、または書面または視覚的な内容を消費するのが難しい他の障害を持つ個人に役立ちます。

貢献者

↑上部に戻ります↑

拡大する

追加情報

バージョン v0.4.0
タイプその他のソースコード
更新時間 2025-02-28
サイズ 135MB
から Github

podcastfy

podcastfy.ai？€？

オーディオの例？

画像

文章

多言語のテキスト

クイックスタート

前提条件

設定

Python

cli

使用法

カスタマイズ？

特徴

証言

Podcastfyで構築されています

更新

V0.4.0+リリース

ライセンス

貢献？

ユースケースの例？

貢献者

Google Dorks

shepherd

hidusbf

mongo express

Free Algorithms Books

markdownpedia

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

hidusbf

Google Dorks

shepherd

hidusbf