podfai
該應用程序允許用戶根據提供的文件以播客的方式創建內容。一些示例將提供論文,演講,項目描述,個人簡歷或其他許多例子。
我還寫了一篇博客文章來討論這個項目,請確保檢查“如何使用生成AI來創建任何輸入中的播客風格的內容”。
它如何工作

如何使用
- 提供一個或多個文件。
- 可選地,自定義來賓和主機的聲音,您可以在此處查看語音樣本。
- 單擊“生成播客”,然後等待片刻。
- 播放音頻,並隨意遵循文字成績單。
例子

播客從我的另一個項目“ AI Beats”中產生
PODCAST-AI_BEAST.MP4
播客從我的另一個項目“ AI預告片”中產生
PODCAST-AI_TRAILER.MP4
播客從安德魯·休伯曼(Andrew Huberman)的“最佳凌晨”描述中產生
播客Andrew_hubermans.mp4
播客通過個人簡歷生成
播客-Cresume.mp4
本地用法
設定
- 克隆GitHub存儲庫
https://github.com/dimitreOliveira/PodfAI.git
cd PodfAI
- 創建一個新的VENV
python -m venv .venvs/podfai
- 激活VENV
source .venvs/podfai/bin/activate
- 安裝要求
另外,您也可以使用pip運行
pip install -r requirements
- 設置Google API依賴關係
運行該應用程序
要啟動應用程序,請在下面運行make命令
另外,您也可以使用普通Python運行
streamlit run src / app . py
配置
隨意更改默認配置以更改應用程序行為或適應您的需求。
vertex:
project: {VERTEX_AI_PROJECT}
location: {VERTEX_AI_LOCATION}
transcript:
model_id: gemini-1.5-pro-002
transcript_len: 5000
max_output_tokens: 8192
temperature: 1
top_p: 0.95
top_k: 32
- 頂點
- 項目: Vertex AI使用的項目名稱。
- 位置: Vertex AI使用的項目位置。
- 成績單
- Model_ID:用於創建播客成績單的模型。
- Transcript_len:建議的轉錄本長度。
- MAX_OUTPUT_TOKENS:模型生成的最大令牌數量。
- 溫度:溫度控制令牌選擇中的隨機程度。較低的溫度適合期望真正或正確反應的提示,而較高的溫度會導致更多樣化或意外的結果。溫度為0,總是選擇最高的概率令牌
- TOP_P: TOP-P會更改模型為輸出選擇令牌的方式。從最可能到最低的可能性,直到其概率之和等於頂級P值之前,代幣是最少的。例如,如果令牌A,B和C的概率為.3,.2和.1,並且TOP-P值為0.5,則模型將選擇A或B作為下一個令牌(使用溫度)
- TOP_K: TOP-K會更改模型選擇令牌以進行輸出。 1的頂部為1表示選定的令牌是模型詞彙中所有令牌中最可能的令牌(也稱為貪婪解碼),而3個top-k表示下一代幣是從3個最可能的令牌中選擇的下一個標記(使用溫度)。
托多
- 支持語音克隆
- 支持其他語言
- 支持其他輸入類型(圖像,視頻,YouTube URL)
- 添加示例筆記本以在Colab中運行
- 使用開源型號複製工作流程
- 實驗代理工作流程以改進播客筆錄
參考
- Google Cloud-文本到語音客戶庫庫
- 在本地設置Google Cloud TTS
- Google Cloud TTS語音列表
貢獻
如果您有興趣為該項目做出貢獻,請非常感謝!在創建PR之前,請確保提交代碼,以下運行以下命令:
致謝
- 為此項目提供了Google雲積分。由於Google的ML開發人員計劃團隊的支持,這項項目可以實現。
- 該項目基於Google的NotebookLM,除了播客風格的內容外,它具有許多其他功能,請確保檢查一下。