生成型新聞閱讀器
向您展示, Keezum AI新聞閱讀器!
歡迎來到AI新聞閱讀器存儲庫!該項目展示瞭如何將生成AI工具一起使用來創建複雜而動態的新聞閱讀器Avatar。
配x免責聲明:只要開玩笑就可以根據您的舒適而隨意使用它。
請訪問此鏈接以觀看演示視頻,以觀看梅西(Macy)的行動,她在那裡簡要介紹了兩種常用的藥物。
鑑於生成AI的改善速度,結果令人印象深刻,並且只會隨著時間的流逝而變得更好。為了創建這個演示,我花了0美元,只有25分鐘。
這是我使用的工具:
- Midjourney生成女性藥劑師的圖像
- Openai的Chatgpt生成NewSheadlines腳本
- Elevenlabs的Prime Video AI是從ChatGpt腳本生成音頻的
- D-id的創意真人秀工作室生成了與音頻同步的現實動畫阿凡達視頻(免費試用)
分步指南
(1)Midjourney-圖像生成
- 我們需要一張面孔來代表我們的化身,我們可以使用像Midjourney這樣的圖像生成工具來做到這一點
- Midjourney是OpenAI的免費AI服務,可從文本描述中創建圖像
- 設定:
- Midjourney完全在不和諧方面工作,因此請確保您註冊一個不和諧帳戶(免費)。
- 訪問此Midjourney網站鏈接,該網站會自動帶您進入Discord邀請。
- 接受不和諧邀請到Midjourney。選擇繼續不和諧。
- 單擊MidJourney按鈕(帶有船標圖標),然後選擇任何新移民室,例如
newbies-24 - 在聊天行中,鍵入
/imagine然後是您的描述提示。例如,我使用的提示是“一名具有新聞編輯室背景的紅色外套的女性媒體新聞記者的高質量上身專業照片”。在輸入輸入後按Enter,並給Midjourney一些時間來生成圖像。 - 完成後,您將看到四個圖像的輸出。在圖像集下方,您將看到一組按鈕U1-U4和V1-V4。
- 這四個圖像是從左上方的順時針進行編號。要在您喜歡的一個上獲得新的變化,請選擇“ V1”(或V2,V3或V4),並獲得高分辨率副本,請選擇“ U1”(或U2,U3或U4)。
- 通過選擇其中一個U按鈕獲得所選的高分辨率變體後,單擊圖像,然後選擇“在瀏覽器中打開”。然後,您可以在本地機器上保存高分辨率圖像
(2)遊樂場Chatgpt-文字一代
- 由於每個人都在使用Chatgpt,因此這些天它有點慢,並不是每個人都有興趣支付錢,因此我們可以使用ChatGptplayground非常快速執行我們的任務。我們需要一個可以提供新聞的新聞頭條新聞腳本。為此,我們可以使用ChatGptPlayground。
- Chatgpt是由OpenAI開發的聊天機器人,並於2022年11月推出。它建於OpenAI的GPT-3大型語言模型家族之上。
- 設定:
- 訪問此鏈接以訪問ChatGpt(您需要相應地登錄)
- 在提示部分中,輸入諮詢腳本的相關描述。例如,我使用的提示如下:“創建一個腳本,該腳本首先將自己作為新聞閱讀器介紹為Keezum,然後談論新聞的頭條新聞,並在開始時獲得一些新聞信息,並提供一些新聞信息,並限制了兩到三行Max的限制”。
- 從chatgpt屏幕上的輸出中,將生成的文本複制並保存在本地計算機上的文本文件中。
(3)Elevenlabs-文本到語音的一代
- 接下來,我們要將ChatGpt腳本文本轉換為自然的音頻剪輯。我們可以使用Prime Voice AI(由ElevenLabs)等免費工具來做到這一點
- Prime Voice AI是一種現實且通用的AI語音軟件,它將最引人注目,最豐富和栩栩如生的聲音帶給創作者和出版商,以尋求講故事的最終工具。
- 設定:
- 訪問ElevenLabs頁面,並免費創建一個帳戶。
- 在“語音綜合”頁面上,在設置中選擇一個特定的語音,將文本腳本粘貼到文本部分中,然後單擊“生成”。我選擇的聲音是
premade/Domi ,因為我發現它是最活躍和自然的。也可以針對穩定性和清晰度等事物進行相應的調整。 - 我通過刪除氨氯地平的部分來稍微縮短腳本,因為我不希望演示太長。
- 免費帳戶有一個信用額度,因此請確保明智地將其用於要生成的音頻。
- 在本地計算機上下載並保存.mp3(標題為“ Synthesized_audio.mp3”)。
(4)d -id-逼真的說話頭像(和音頻同步)一代
- 最後,是時候將藥劑師的圖像和諮詢音頻繪製成一個逼真的視頻了。為此,我們可以使用D-ID等工具。
- D-ID的創意AI技術拍攝了面孔的圖像,並將其變成高質量的影片視頻。單擊按鈕,它可以將圖像與音頻或文本相結合,以表達表達和語音。
- 設定:
- 訪問D-ID網站並創建免費試用帳戶
- 選擇創建視頻按鈕以開始創建新視頻
- 將您的Midjourney藥劑師形象添加為主持人圖像
- 在右側的“
Upload your own voice部分中將我們的Chatgpt腳本音頻上傳。 - 單擊右上角的
Generate Video按鈕,然後等待您的傑作準備下載!
依賴性
該項目需要以下依賴關係:
Python 3.6 or higher
Midjourney
OpenAI's GPT-3 API
ElevenLabs' Prime Video AI
D-ID's Creative Reality Studio
未來的工作
我們計劃通過集成更多生成的AI工具並擴大新聞閱讀器Avatar的功能來繼續完善和改進該項目。我們也歡迎社區的任何貢獻或建議。致謝
我們要感謝Midjourney,Openai,Elevenlabs和D-ID的開發人員和研究人員的出色生成AI工具,這使該項目成為可能。
執照
該項目是根據MIT許可證獲得許可的 - 有關詳細信息,請參見許可證文件。