热衷于将最新的生成AI工具投入测试,我创建了这个动画化的化身,能够以现实和专业的方式提供药物咨询。
配x 免责声明:作为个人爱好项目的一部分,该视频纯粹是出于演示目的,并且无意提供任何形式的医疗建议。这不是一个真正的产品,表达的视图是我自己的。
单击下面的缩略图(或访问此链接)以观看演示视频,以观看梅西(Macy)的行动,在那里她简要地谈论了两种常用的药物。
鉴于生成AI的改善速度,结果令人印象深刻,并且只会随着时间的流逝而变得更好。为了创建这个演示,我花了0美元,只有25分钟。
这是我使用的工具:
我们需要一张面孔来代表我们的化身,我们可以使用像Midjourney这样的图像生成工具来做到这一点
Midjourney是OpenAI的免费AI服务,可从文本描述中创建图像
设置:
newbies-24 
/imagine然后是您的描述提示。例如,我使用的提示是“一名具有药房背景的白色实验室外套的女性药剂师的高质量上身专业照片”。在输入输入后按Enter,并给Midjourney一些时间来生成图像。 


我还尝试了其他工具,例如dall-e和稳定的扩散,但它们的结果还不够现实(例如,眼睛错位和面部特征)。
注意:截至2023年4月,Midjourney已暂停其免费试用计划。要生成现实的面部图片,您可以使用以下任何一个:
我们需要一个咨询脚本,可以就一组药物提供相关建议。为此,我们可以使用chatgpt。
Chatgpt是由OpenAI开发的聊天机器人,并于2022年11月推出。它建于OpenAI的GPT-3大型语言模型家族之上。
设置:

我不得不多次再生反应,因为我发现一些产量过于理论和学术,并且不采用预期的外行形式来解释对患者的药物。
接下来,我们要将ChatGpt脚本文本转换为自然的音频剪辑。我们可以使用Prime Voice AI(由ElevenLabs)等免费工具来做到这一点
Prime Voice AI是一种现实且通用的AI语音软件,它将最引人注目,最丰富和栩栩如生的声音带给创作者和出版商,以寻求讲故事的最终工具。
设置:
premade/Domi ,因为我发现它是最活跃和自然的。也可以针对稳定性和清晰度等事物进行相应的调整。 
我通过删除氨氯地平的部分来稍微缩短脚本,因为我不希望演示太长。
免费帐户有一个信用额度,因此请确保明智地将其用于要生成的音频。
在本地计算机上下载并保存.mp3(标题为“ Synthesized_audio.mp3”)。
奖励提示:ElevenLabs还具有语音克隆功能(在语音实验室功能下):https://beta.elevenlabs.io/voice-lab。如果您对特定语音的录制> 1分钟,则可以将脚本转换为要克隆的语音。
最后,是时候将药剂师的图像和咨询音频绘制成一个逼真的视频了。为此,我们可以使用D-ID等工具。
D-ID的创意AI技术拍摄了面孔的图像,并将其变成高质量的影片视频。单击按钮,它可以将图像与音频或文本相结合,以表达表达和语音。
设置:
Upload your own voice部分中将我们的Chatgpt脚本音频上传。 
Generate Video按钮,然后等待您的杰作准备下载!