Soucieux de mettre les derniers outils d'IA génératifs à l'épreuve, j'ai créé cet avatar animé capable de fournir des conseils de médicaments d'une manière réaliste et professionnelle.
️ Avertissement: Cette vidéo est uniquement à des fins de démonstration dans le cadre d'un projet de passe-temps personnel et n'est pas destiné à fournir une forme de conseil médical. Ce n'est pas un vrai produit, et les vues exprimées sont les miennes.
Cliquez sur la vignette ci-dessous (ou visitez ce lien) pour regarder la vidéo de démonstration pour voir Macy en action, où elle parle brièvement de deux médicaments couramment prescrits.
Le résultat est assez impressionnant et ne fera que s'améliorer avec le temps, étant donné la vitesse à laquelle l'IA génératrice s'améliore. Pour créer cette démo, il m'a fallu 0 dollars et seulement 25 minutes.
Voici les outils que j'ai utilisés:
Nous avons besoin d'un visage pour représenter notre avatar, et nous pouvons utiliser des outils de génération d'images comme MidJourney pour faire exactement cela
MidJourney est un service d'IA gratuit d'OpenAI qui crée des images à partir de descriptions textuelles
Installation:
newbies-24 
/imagine suivi de votre invite de description. Par exemple, l'invite que j'ai utilisée était "une photo professionnelle du haut du corps de haute qualité d'un pharmacien chinois dans une blouse de laboratoire blanche avec un fond de pharmacie". Appuyez sur Entrée après l'avoir tapé et donnez à MidJourney un peu de temps pour générer les images. 


J'ai également essayé d'autres outils comme Dall-E et une diffusion stable, mais leurs résultats n'étaient pas assez réalistes (par exemple, les yeux mal alignés et les caractéristiques faciales).
Remarque : MidJourney a interrompu son programme d'essai gratuit en avril 2023. Pour générer des images faciales réalistes, vous pouvez utiliser l'une des éléments suivants:
Nous avons besoin d'un script de conseil qui peut donner des conseils pertinents sur un ensemble de médicaments. Pour ce faire, nous pouvons utiliser Chatgpt.
Chatgpt est un chatbot développé par Openai et lancé en novembre 2022. Il est construit au-dessus de la famille GPT-3 d'Openai de modèles de grande langue.
Installation:

J'ai dû régénérer la réponse plusieurs fois parce que j'ai trouvé que certaines des résultats étaient trop théoriques et académiques, et n'est pas dans le format profane attendu pour expliquer les médicaments aux patients.
Ensuite, nous voulons convertir le texte du script Chatgpt en un clip audio naturel. Nous pouvons le faire avec des outils gratuits comme Prime Voice AI (par ElevenLabs)
Prime Voice AI est un logiciel de discours d'IA réaliste et polyvalent qui apporte les voix les plus convaincantes, les plus riches et les plus réalistes aux créateurs et aux éditeurs qui recherchent les outils ultimes pour la narration.
Installation:
premade/Domi car je l'ai trouvé la plus vivante et la plus naturelle. Les paramètres peuvent également être ajustés en conséquence pour des choses comme la stabilité et la clarté. 
J'ai légèrement raccourci le script en supprimant la section sur l'amlodipine médicamenteuse parce que je ne voulais pas que la démo soit trop longue.
Il y a une limite de crédit pour le compte gratuit, alors assurez-vous de les utiliser judicieusement pour l'audio que vous souhaitez générer.
Téléchargez et enregistrez le fichier .mp3 (intitulé 'synthétisé_audio.mp3') sur votre machine locale.
Conseil bonus: ElevenLabs est également livré avec les capacités de clonage vocale (sous la fonction de laboratoire vocale): https://beta.elevenlabs.io/voice-lab. Si vous avez> 1 min d'enregistrement d'une voix particulière, vous pouvez convertir le script en la voix que vous souhaitez clone.
Enfin, il est temps de reconstituer l'image du pharmacien et de conseiller l'audio dans une vidéo photoréaliste. Pour ce faire, nous pouvons utiliser des outils comme D-ID.
La technologie créative de l'ID de D-ID prend des images de visages et les transforme en vidéos photoréalistes de haute qualité. Au clic sur un bouton, il peut combiner des images avec l'audio ou le texte pour leur donner l'expression et la parole.
Installation:
Upload your own voice à droite. 
Generate Video en haut à droite et attendez que votre chef-d'œuvre soit prêt à télécharger!