熱衷於將最新的生成AI工具投入測試,我創建了這個動畫化的化身,能夠以現實和專業的方式提供藥物諮詢。
配x 免責聲明:作為個人愛好項目的一部分,該視頻純粹是出於演示目的,並且無意提供任何形式的醫療建議。這不是一個真正的產品,表達的視圖是我自己的。
單擊下面的縮略圖(或訪問此鏈接)以觀看演示視頻,以觀看梅西(Macy)的行動,在那裡她簡要地談論了兩種常用的藥物。
鑑於生成AI的改善速度,結果令人印象深刻,並且只會隨著時間的流逝而變得更好。為了創建這個演示,我花了0美元,只有25分鐘。
這是我使用的工具:
我們需要一張面孔來代表我們的化身,我們可以使用像Midjourney這樣的圖像生成工具來做到這一點
Midjourney是OpenAI的免費AI服務,可從文本描述中創建圖像
設定:
newbies-24 
/imagine然後是您的描述提示。例如,我使用的提示是“一名具有藥房背景的白色實驗室外套的女性藥劑師的高質量上身專業照片”。在輸入輸入後按Enter,並給Midjourney一些時間來生成圖像。 


我還嘗試了其他工具,例如dall-e和穩定的擴散,但它們的結果還不夠現實(例如,眼睛錯位和麵部特徵)。
注意:截至2023年4月,Midjourney已暫停其免費試用計劃。要生成現實的面部圖片,您可以使用以下任何一個:
我們需要一個諮詢腳本,可以就一組藥物提供相關建議。為此,我們可以使用chatgpt。
Chatgpt是由OpenAI開發的聊天機器人,並於2022年11月推出。它建於OpenAI的GPT-3大型語言模型家族之上。
設定:

我不得不多次再生反應,因為我發現一些產量過於理論和學術,並且不採用預期的外行形式來解釋對患者的藥物。
接下來,我們要將ChatGpt腳本文本轉換為自然的音頻剪輯。我們可以使用Prime Voice AI(由ElevenLabs)等免費工具來做到這一點
Prime Voice AI是一種現實且通用的AI語音軟件,它將最引人注目,最豐富和栩栩如生的聲音帶給創作者和出版商,以尋求講故事的最終工具。
設定:
premade/Domi ,因為我發現它是最活躍和自然的。也可以針對穩定性和清晰度等事物進行相應的調整。 
我通過刪除氨氯地平的部分來稍微縮短腳本,因為我不希望演示太長。
免費帳戶有一個信用額度,因此請確保明智地將其用於要生成的音頻。
在本地計算機上下載並保存.mp3(標題為“ Synthesized_audio.mp3”)。
獎勵提示:ElevenLabs還具有語音克隆功能(在語音實驗室功能下):https://beta.elevenlabs.io/voice-lab。如果您對特定語音的錄製> 1分鐘,則可以將腳本轉換為要克隆的語音。
最後,是時候將藥劑師的圖像和諮詢音頻繪製成一個逼真的視頻了。為此,我們可以使用D-ID等工具。
D-ID的創意AI技術拍攝了面孔的圖像,並將其變成高質量的影片視頻。單擊按鈕,它可以將圖像與音頻或文本相結合,以表達表達和語音。
設定:
Upload your own voice部分中將我們的Chatgpt腳本音頻上傳。 
Generate Video按鈕,然後等待您的傑作準備下載!