Image2AudioStoryConverter
1.0.0
使用圖像到文本,語言模型和文本到語音技術的組合將圖像轉換為迷人的音頻故事。

該項目使您可以將圖像變成音頻故事。它採用圖像到文本轉換,語言模型和文本到語音綜合來創造引人入勝的體驗。從上傳的圖像中提取文本,根據提取的文本生成短篇小說,然後以音頻剪輯來聆聽生成的故事。
克隆存儲庫:
git clone https://github.com/fshnkarimi/Image2AudioStoryConverter.git
cd Image2AudioStoryConverter安裝依賴項:
pip install -r requirements.txt設置環境變量:在項目目錄中創建.env文件,並添加您的擁抱面api令牌:
HUGGINGFACEHUB_API_TOKEN=your_token_here
運行簡化應用程序:
streamlit run app.py上傳圖像:
體驗故事:
歡迎捐款!如果您想為此項目做出貢獻,請按照以下步驟操作:
享受將圖像變成迷人的音頻故事!如您所見,可以隨意自定義和增強該項目。如果您有任何改進的疑問或想法,請隨時保持聯繫。