生成型新闻阅读器
向您展示, Keezum AI新闻阅读器!
欢迎来到AI新闻阅读器存储库!该项目展示了如何将生成AI工具一起使用来创建复杂而动态的新闻阅读器Avatar。
配x免责声明:只要开玩笑就可以根据您的舒适而随意使用它。
请访问此链接以观看演示视频,以观看梅西(Macy)的行动,她在那里简要介绍了两种常用的药物。
鉴于生成AI的改善速度,结果令人印象深刻,并且只会随着时间的流逝而变得更好。为了创建这个演示,我花了0美元,只有25分钟。
这是我使用的工具:
- Midjourney生成女性药剂师的图像
- Openai的Chatgpt生成NewSheadlines脚本
- Elevenlabs的Prime Video AI是从ChatGpt脚本生成音频的
- D-id的创意真人秀工作室生成了与音频同步的现实动画阿凡达视频(免费试用)
分步指南
(1)Midjourney-图像生成
- 我们需要一张面孔来代表我们的化身,我们可以使用像Midjourney这样的图像生成工具来做到这一点
- Midjourney是OpenAI的免费AI服务,可从文本描述中创建图像
- 设置:
- Midjourney完全在不和谐方面工作,因此请确保您注册一个不和谐帐户(免费)。
- 访问此Midjourney网站链接,该网站会自动带您进入Discord邀请。
- 接受不和谐邀请到Midjourney。选择继续不和谐。
- 单击MidJourney按钮(带有船标图标),然后选择任何新移民室,例如
newbies-24 - 在聊天行中,键入
/imagine然后是您的描述提示。例如,我使用的提示是“一名具有新闻编辑室背景的红色外套的女性媒体新闻记者的高质量上身专业照片”。在输入输入后按Enter,并给Midjourney一些时间来生成图像。 - 完成后,您将看到四个图像的输出。在图像集下方,您将看到一组按钮U1-U4和V1-V4。
- 这四个图像是从左上方的顺时针进行编号。要在您喜欢的一个上获得新的变化,请选择“ V1”(或V2,V3或V4),并获得高分辨率副本,请选择“ U1”(或U2,U3或U4)。
- 通过选择其中一个U按钮获得所选的高分辨率变体后,单击图像,然后选择“在浏览器中打开”。然后,您可以在本地机器上保存高分辨率图像
(2)游乐场Chatgpt-文字一代
- 由于每个人都在使用Chatgpt,因此这些天它有点慢,并不是每个人都有兴趣支付钱,因此我们可以使用ChatGptplayground非常快速执行我们的任务。我们需要一个可以提供新闻的新闻头条新闻脚本。为此,我们可以使用ChatGptPlayground。
- Chatgpt是由OpenAI开发的聊天机器人,并于2022年11月推出。它建于OpenAI的GPT-3大型语言模型家族之上。
- 设置:
- 访问此链接以访问ChatGpt(您需要相应地登录)
- 在提示部分中,输入咨询脚本的相关描述。例如,我使用的提示如下:“创建一个脚本,该脚本首先将自己作为新闻阅读器介绍为Keezum,然后谈论新闻的头条新闻,并在开始时获得一些新闻信息,并提供一些新闻信息,并限制了两到三行Max的限制”。
- 从chatgpt屏幕上的输出中,将生成的文本复制并保存在本地计算机上的文本文件中。
(3)Elevenlabs-文本到语音的一代
- 接下来,我们要将ChatGpt脚本文本转换为自然的音频剪辑。我们可以使用Prime Voice AI(由ElevenLabs)等免费工具来做到这一点
- Prime Voice AI是一种现实且通用的AI语音软件,它将最引人注目,最丰富和栩栩如生的声音带给创作者和出版商,以寻求讲故事的最终工具。
- 设置:
- 访问ElevenLabs页面,并免费创建一个帐户。
- 在“语音综合”页面上,在设置中选择一个特定的语音,将文本脚本粘贴到文本部分中,然后单击“生成”。我选择的声音是
premade/Domi ,因为我发现它是最活跃和自然的。也可以针对稳定性和清晰度等事物进行相应的调整。 - 我通过删除氨氯地平的部分来稍微缩短脚本,因为我不希望演示太长。
- 免费帐户有一个信用额度,因此请确保明智地将其用于要生成的音频。
- 在本地计算机上下载并保存.mp3(标题为“ Synthesized_audio.mp3”)。
(4)d -id-逼真的说话头像(和音频同步)一代
- 最后,是时候将药剂师的图像和咨询音频绘制成一个逼真的视频了。为此,我们可以使用D-ID等工具。
- D-ID的创意AI技术拍摄了面孔的图像,并将其变成高质量的影片视频。单击按钮,它可以将图像与音频或文本相结合,以表达表达和语音。
- 设置:
- 访问D-ID网站并创建免费试用帐户
- 选择创建视频按钮以开始创建新视频
- 将您的Midjourney药剂师形象添加为主持人图像
- 在右侧的“
Upload your own voice部分中将我们的Chatgpt脚本音频上传。 - 单击右上角的
Generate Video按钮,然后等待您的杰作准备下载!
依赖性
该项目需要以下依赖关系:
Python 3.6 or higher
Midjourney
OpenAI's GPT-3 API
ElevenLabs' Prime Video AI
D-ID's Creative Reality Studio
未来的工作
我们计划通过集成更多生成的AI工具并扩大新闻阅读器Avatar的功能来继续完善和改进该项目。我们也欢迎社区的任何贡献或建议。致谢
我们要感谢Midjourney,Openai,Elevenlabs和D-ID的开发人员和研究人员的出色生成AI工具,这使该项目成为可能。
执照
该项目是根据MIT许可证获得许可的 - 有关详细信息,请参见许可证文件。