最新の生成的AIツールをテストに入れたいと思います。私は、現実的かつプロフェッショナルな方法で薬物カウンセリングを提供できるこのアニメーションアバターを作成しました。
ショ和 免責事項:このビデオは、個人的な趣味プロジェクトの一環として純粋にデモの目的であり、いかなる形態の医学的アドバイスを提供することを意図していません。これは実際の製品ではなく、表現されたビューは私自身のものです。
下のサムネイルをクリックし(またはこのリンクにアクセスして)、デモビデオを視聴してメイシーが動作しているのを見てください。彼女は2つの一般的に処方された薬について簡単に話します。
結果は非常に印象的であり、生成AIが改善している速度を考えると、時間とともに良くなります。このデモを作成するには、0ドル、わずか25分かかりました。
これが私が使用したツールです:
私たちはアバターを表すために顔が必要であり、Midjourneyのような画像生成ツールを使用してそれを行うことができます
Midjourneyは、テキストの説明から画像を作成するOpenaiによる無料のAIサービスです
設定:
newbies-24などの新人の部屋のいずれかを選択します
/imagineに続いて説明プロンプトが続きます。たとえば、私が使用したプロンプトは、「薬局の背景を持つ白い白衣を着た女性の中国の薬剤師の高品質の上半身のプロの写真」でした。入力後にEnterを押し、Midjourneyに時間をかけて画像を生成します。 


また、Dall-Eや安定した拡散などの他のツールを試しましたが、その結果は十分に現実的ではありませんでした(たとえば、目や顔の特徴がずれています)。
注:Midjourneyは2023年4月の時点で無料の試用プログラムを一時停止しました。現実的なフェイシャル写真を生成するには、次のいずれかを使用できます。
一連の薬に関する関連するアドバイスを提供できるカウンセリングスクリプトが必要です。それを行うには、chatgptを使用できます。
ChatGptは、Openaiが開発し、2022年11月に発売されたチャットボットです。Openaiの大規模な言語モデルのGPT-3ファミリーの上に構築されています。
設定:

出力の一部が過度に理論的かつ学問的であることがわかったため、患者に薬を説明するために予想される素人形式ではないため、何度か反応を再生しなければなりませんでした。
次に、ChatGPTスクリプトテキストを自然なサウンドオーディオクリップに変換します。 Prime Voice AI(ElevenLabs)などの無料ツールでこれを行うことができます
Prime Voice AIは、ストーリーテリングの究極のツールを求めているクリエイターや出版社に最も説得力があり、リッチでリアルな声をもたらす現実的で汎用性の高いAIスピーチソフトウェアです。
設定:
premade/Domiでした。安定性や明確さなど、設定をそれに応じて調整することもできます。 
デモが長すぎたくないので、薬物アムロジピンのセクションを削除することにより、スクリプトをわずかに短縮しました。
無料アカウントにはクレジット制限がありますので、生成したいオーディオに賢明に使用してください。
ローカルマシンにファイルをダウンロードして保存します。
ボーナスのヒント:ElevenLabsには、音声クローニング機能(音声ラボ機能の下)が付属しています:https://beta.elevenlabs.io/voice-lab。特定の音声を1分以上録音している場合は、スクリプトをクローンする音声に変換できます。
最後に、薬剤師の画像とカウンセリングオーディオを一緒にフォトリアリスティックなビデオに載せます。そのためには、D-IDなどのツールを使用できます。
D-IDのクリエイティブなAIテクノロジーは、顔の画像を撮影し、それらを高品質の光リアリスティックなビデオに変えます。ボタンをクリックすると、画像とオーディオまたはテキストを組み合わせて表現と音声を与えることができます。
設定:
Upload your own voiceて、ChatGPTスクリプトオーディオをアップロードします。 
Generate Videoボタンをクリックして、傑作がダウンロードの準備が整うのを待ちます!