Ich war bestrebt, die neuesten generativen KI-Tools auf die Probe zu stellen, und habe diesen animierten Avatar erstellt, der in realistischem und professionellem klingendem Medikamentenberatung in der Lage ist.
Euen Haftungsausschluss: Dieses Video dient nur für Demo -Zwecke als Teil eines persönlichen Hobbyprojekts und soll keine medizinische Beratung geben. Dies ist kein echtes Produkt, und die geäußerten Ansichten sind meine eigenen.
Klicken Sie unten auf das Miniaturbild (oder besuchen Sie diesen Link), um das Demo-Video anzusehen, um Macy in Aktion zu sehen, wo sie kurz über zwei häufig vorgeschriebene Medikamente spricht.
Das Ergebnis ist ziemlich beeindruckend und wird angesichts der Geschwindigkeit, mit der sich generative KI verbessert, nur besser. Um diese Demo zu erstellen, brauchte ich 0 Dollar und nur 25 Minuten.
Hier sind die Werkzeuge, die ich verwendet habe:
Wir brauchen ein Gesicht, um unseren Avatar zu repräsentieren, und wir können die Image -Generierungs -Tools wie Midjourney verwenden, um genau das zu tun
Midjourney ist ein kostenloser KI -Service von OpenAI, der Bilder aus Textbeschreibungen erstellt
Aufstellen:
newbies-24 
/imagine eine Eingabeaufforderung an. Zum Beispiel war die Eingabeaufforderung, die ich verwendete, "hochwertiges Oberkörperfoto eines weiblichen chinesischen Apothekers in einem weißen Labormantel mit einem Apothekenhintergrund". Drücken Sie die Eingabe nach dem Eingeben und geben Sie Midjourney einige Zeit, um die Bilder zu generieren. 


Ich habe auch andere Werkzeuge wie Dall-E und stabile Diffusion ausprobiert, aber ihre Ergebnisse waren nicht realistisch genug (z. B. falsch ausgerichtete Augen und Gesichtsmerkmale).
Hinweis : Midjourney hat sein kostenloses Testprogramm ab April 2023 inneha. Um realistische Gesichtsbilder zu generieren, können Sie eine der folgenden folgenden verwenden:
Wir brauchen ein Beratungsskript, das einen relevanten Rat zu einer Reihe von Medikamenten geben kann. Dazu können wir Chatgpt verwenden.
Chatgpt ist ein von OpenAI entwickelter Chatbot, der im November 2022 auf den Markt gebracht wurde. Es basiert auf OpenAs GPT-3-Familie mit großer Sprachmodellen.
Aufstellen:

Ich musste die Reaktion mehrmals regenerieren, weil ich einen Teil der Produktion als übermäßig theoretisch und akademisch fand und nicht im erwarteten Laienformat zur Erklärung von Medikamenten für Patienten ist.
Als nächstes möchten wir den ChatGPT -Skripttext in einen natürlichen Sound -Audioclip umwandeln. Wir können dies mit kostenlosen Werkzeugen wie Prime Voice AI (von elf Labs) tun
Prime Voice AI ist eine realistische und vielseitige KI -Sprachsoftware, die den Schöpfer und Publisher, die die ultimativen Werkzeuge für das Geschichtenerzählen suchen, die überzeugendsten, reichhaltigsten und lebensechten Stimmen verleiht.
Aufstellen:
premade/Domi , da ich feststellte, dass es die lebhafteste und natürlichste. Die Einstellungen können auch entsprechend für Dinge wie Stabilität und Klarheit angepasst werden. 
Ich habe das Drehbuch leicht verkürzt, indem ich den Abschnitt über das Arzneimittelamlodipin entfernt habe, weil ich nicht wollte, dass die Demo zu lang ist.
Es gibt ein Kreditlimit für das kostenlose Konto. Stellen Sie daher sicher, dass Sie sie mit Bedacht für das Audio verwenden, das Sie generieren möchten.
Laden Sie die Datei .mp3 (mit dem Titel "Synthesized_audio.mp3") auf Ihrem lokalen Computer herunter und speichern Sie sie.
Bonus-Tipp: Elevenlabs werden auch mit den Sprachklonierungsfunktionen (im Rahmen der Voice Lab-Funktion) geliefert: https://beta.elevenlabs.io/voice-lab. Wenn Sie> 1 min Aufzeichnung einer bestimmten Stimme haben, können Sie das Skript in die Stimme umwandeln, die Sie klonen möchten.
Zuletzt ist es Zeit, das Apothekerbild zu packen und Audio in ein fotorealistisches Video zu beraten. Dazu können wir Tools wie D-ID verwenden.
Die kreative KI-Technologie von D-ID macht Bilder von Gesichtern und verwandelt sie in hochwertige, fotorealistische Videos. Beim Klicken einer Schaltfläche kann es Bilder mit Audio oder Text kombinieren, um ihnen Ausdruck und Sprache zu verleihen.
Aufstellen:
Upload your own voice rechts hoch. 
Generate Video und warten Sie, bis Ihr Meisterwerk zum Download bereit ist!