Deseoso de poner a prueba las últimas herramientas generativas de IA, creé este avatar animado capaz de entregar asesoramiento de medicamentos de una manera realista y profesional.
️ Descargo de responsabilidad: este video es puramente para fines de demostración como parte de un proyecto de pasatiempo personal y no tiene la intención de proporcionar ninguna forma de asesoramiento médico. Este no es un producto real, y las opiniones expresadas son mías.
Haga clic en la miniatura a continuación (o visite este enlace) para ver el video de demostración para ver a Macy en acción, donde habla brevemente de dos medicamentos comúnmente prescritos.
El resultado es bastante impresionante y solo mejorará con el tiempo, dada la velocidad a la que está mejorando la IA generativa. Para crear esta demostración, me tomó 0 dólares y solo 25 minutos.
Aquí están las herramientas que utilicé:
Necesitamos una cara para representar a nuestro avatar, y podemos usar herramientas de generación de imágenes como MidJourney para hacer exactamente eso
MidJourney es un servicio de IA gratuito de OpenAI que crea imágenes de descripciones textuales
Configuración:
newbies-24 
/imagine seguido de su mensaje de descripción. Por ejemplo, el aviso que utilicé fue "foto profesional de alta calidad de la parte superior del cuerpo de una farmacéutica china en una bata de laboratorio blanco con fondo de farmacia". Presione ENTER después de escribirlo y dale a Midjourney algo de tiempo para generar las imágenes. 


También probé otras herramientas como Dall-E y la difusión estable, pero sus resultados no fueron lo suficientemente realistas (por ejemplo, ojos desalineados y características faciales).
Nota : MidJourney ha detenido su programa de prueba gratuito a partir de abril de 2023. Para generar imágenes faciales realistas, puede usar cualquiera de los siguientes:
Necesitamos un guión de asesoramiento que pueda dar consejos relevantes sobre un conjunto de medicamentos. Para hacer eso, podemos usar chatgpt.
ChatGPT es un chatbot desarrollado por OpenAI y se lanzó en noviembre de 2022. Está construido sobre la familia GPT-3 de modelos de idiomas grandes de Openai.
Configuración:

Tuve que regenerar la respuesta varias veces porque encontré que parte del resultado era demasiado teórico y académico, y no está en el formato de laico esperado para explicar los medicamentos a los pacientes.
A continuación, queremos convertir el texto del script ChatGPT en un clip de audio de sonido natural. Podemos hacerlo con herramientas gratuitas como Prime Voice Ai (de Elevenlabs)
Prime Voice AI es un software de habla AI realista y versátil que brinda las voces más convincentes, ricas y realistas a los creadores y editores que buscan las herramientas finales para la narración de historias.
Configuración:
premade/Domi ya que me pareció la más animada y natural. La configuración también se puede ajustar en consecuencia para cosas como la estabilidad y la claridad. 
Acorté el guión ligeramente quitando la sección sobre la droga de amlodipino porque no quería que la demostración fuera demasiado larga.
Hay un límite de crédito para la cuenta gratuita, así que asegúrese de usarlos sabiamente para el audio que desea generar.
Descargue y guarde el archivo .mp3 (titulado 'Synthesized_audio.mp3') en su máquina local.
Consejo adicional: Elevenlabs también viene con las capacidades de clonación de voz (debajo de la función de laboratorio de voz): https://beta.elevenlabs.io/voice-lab. Si tiene una grabación> 1 min de una voz en particular, puede convertir el script en la voz que desea clonar.
Por último, es hora de reunir la imagen farmacéutica y aconsejar audio en un video fotorrealista. Para hacerlo, podemos usar herramientas como D-ID.
La tecnología AI creativa de D-ID toma imágenes de caras y las convierte en videos fotorrealistas de alta calidad. Con un clic de un botón, puede combinar imágenes con audio o texto para darles expresión y discurso.
Configuración:
Upload your own voice a la derecha. 
Generate Video en la parte superior derecha y espere a que su obra maestra esté lista para descargar!