Generative AI Pharmacistダウンロード - Generative AI Pharmacistソースコードダウンロード

Generative AI Pharmacist

その他のソースコード

1.0.0

ダウンロード

生成AI薬剤師

あなたに提示して、メイシー・アイ・ファーマシスト！

最新の生成的AIツールをテストに入れたいと思います。私は、現実的かつプロフェッショナルな方法で薬物カウンセリングを提供できるこのアニメーションアバターを作成しました。

ショ和免責事項：このビデオは、個人的な趣味プロジェクトの一環として純粋にデモの目的であり、いかなる形態の医学的アドバイスを提供することを意図していません。これは実際の製品ではなく、表現されたビューは私自身のものです。

下のサムネイルをクリックし（またはこのリンクにアクセスして）、デモビデオを視聴してメイシーが動作しているのを見てください。彼女は2つの一般的に処方された薬について簡単に話します。

結果は非常に印象的であり、生成AIが改善している速度を考えると、時間とともに良くなります。このデモを作成するには、0ドル、わずか25分かかりました。

これが私が使用したツールです：

女性の薬剤師のイメージを生成するためのミッドジャーニー
OpenaiのChatgptは、薬物カウンセリング用のスクリプトを生成します
chatgptスクリプトからオーディオを生成するためのelevenlabsのプライムビデオAI
D-IDのクリエイティブリアリティスタジオは、オーディオと同期されたリアルなアニメーションアバタービデオを生成する（無料トライアル）

このプロジェクトは、Ju Open Plus（アメリカ泌尿器泌尿器協会の公式ジャーナル）に掲載された、専門家の検証を備えた医学生による部分的な腎摘出術のための人工知能による患者情報ビデオの患者情報ビデオのビデオビデオ）でも誇らしげに取り上げられています。 https://journals.lww.com/juop/fulltext/2024/07000/artificial_intelligence_generated_patient.1.aspx

ステップバイステップガイド

（1）Midjourney-画像生成

私たちはアバターを表すために顔が必要であり、Midjourneyのような画像生成ツールを使用してそれを行うことができます
Midjourneyは、テキストの説明から画像を作成するOpenaiによる無料のAIサービスです
設定：
1. Midjourneyは完全に不和で動作しますので、必ず不一致アカウント（無料です）にサインアップしてください。
2. このMidjourneyサイトリンクにアクセスしてください。これにより、自動的に不一致の招待状に移動します。
3. ミッドジャーニーへの不一致の招待状を受け入れてください。不和を続けることを選択します。
4. Midjourneyボタン（船のアイコン付き）をクリックして、 newbies-24などの新人の部屋のいずれかを選択します
1. チャットラインでは、タイプ/imagineに続いて説明プロンプトが続きます。たとえば、私が使用したプロンプトは、「薬局の背景を持つ白い白衣を着た女性の中国の薬剤師の高品質の上半身のプロの写真」でした。入力後にEnterを押し、Midjourneyに時間をかけて画像を生成します。
1. 完了すると、4つの画像の出力が表示されます。画像セットの下には、ボタンU1-U4のセットとV1-V4が表示されます。
1. 4つの画像には、左上から時計回りに番号が付けられています。好きな特定の画像の新しいバリエーションを取得するには、「V1」（またはV2、V3、またはV4）を選択し、高解像度のコピーを取得するには、「U1」（またはU2、U3、またはU4）を選択します。
2. Uボタンのいずれかをクリックして選択した高解像度バリアントを使用したら、画像をクリックしてから、下部近くの[ブラウザで開く]リンクをクリックします。その後、高解像度の画像を右クリックしてコンピューターに保存できます。

また、Dall-Eや安定した拡散などの他のツールを試しましたが、その結果は十分に現実的ではありませんでした（たとえば、目や顔の特徴がずれています）。

注：Midjourneyは2023年4月の時点で無料の試用プログラムを一時停止しました。現実的なフェイシャル写真を生成するには、次のいずれかを使用できます。

インターネット上の写真を操作するベース画像として見つけたり、自分の写真を使用したりすることさえあります
https://this-person-does-not-exist.com/en（stylegan algorithmに基づく）に向かい、現実的な顔を生成します
試してみることができる他のウェブサイトには、https：//lexica.artおよびhttps://playgroundai.com/が含まれます。

（2）ChatGpt-テキスト生成

一連の薬に関する関連するアドバイスを提供できるカウンセリングスクリプトが必要です。それを行うには、chatgptを使用できます。
ChatGptは、Openaiが開発し、2022年11月に発売されたチャットボットです。Openaiの大規模な言語モデルのGPT-3ファミリーの上に構築されています。
設定：
1. このリンクにアクセスしてChatGptにアクセスします（それに応じてサインアップしてログインする必要があります。これは無料です）
2. プロンプトセクションで、カウンセリングスクリプトの関連説明を入力します。たとえば、私が使用したプロンプトは次のとおりです。「最初にメイシーと呼ばれる薬剤師として自分自身を紹介するスクリプトを作成し、次に次の処方についてカウンセリングポイントについて患者に語ります：メトホルミン1錠剤1日3回、アムロジピン1錠、毎朝アスピリン1錠剤」。
1. ChatGPT画面の出力から、ローカルマシンのテキストファイルに生成されたテキストをコピーして保存します。

出力の一部が過度に理論的かつ学問的であることがわかったため、患者に薬を説明するために予想される素人形式ではないため、何度か反応を再生しなければなりませんでした。

（3）ElevenLabs-Text-to-Speech生成

次に、ChatGPTスクリプトテキストを自然なサウンドオーディオクリップに変換します。 Prime Voice AI（ElevenLabs）などの無料ツールでこれを行うことができます
Prime Voice AIは、ストーリーテリングの究極のツールを求めているクリエイターや出版社に最も説得力があり、リッチでリアルな声をもたらす現実的で汎用性の高いAIスピーチソフトウェアです。
設定：
1. ElevenLabsページにアクセスして、無料でアカウントを作成してください。
2. Speech Synthesisページで、設定の特定の音声を選択し、テキストスクリプトをテキストセクションに貼り付け、[生成]をクリックします。私が選んだ声は、それが最も活気があり自然であることがわかったのでpremade/Domiでした。安定性や明確さなど、設定をそれに応じて調整することもできます。
デモが長すぎたくないので、薬物アムロジピンのセクションを削除することにより、スクリプトをわずかに短縮しました。
1. 無料アカウントにはクレジット制限がありますので、生成したいオーディオに賢明に使用してください。
2. ローカルマシンにファイルをダウンロードして保存します。

ボーナスのヒント：ElevenLabsには、音声クローニング機能（音声ラボ機能の下）が付属しています：https：//beta.elevenlabs.io/voice-lab。特定の音声を1分以上録音している場合は、スクリプトをクローンする音声に変換できます。

（4）D -ID-フォトリアリスティックトーキングアバター（およびオーディオ同期）生成

最後に、薬剤師の画像とカウンセリングオーディオを一緒にフォトリアリスティックなビデオに載せます。そのためには、D-IDなどのツールを使用できます。
D-IDのクリエイティブなAIテクノロジーは、顔の画像を撮影し、それらを高品質の光リアリスティックなビデオに変えます。ボタンをクリックすると、画像とオーディオまたはテキストを組み合わせて表現と音声を与えることができます。
設定：
1. D-IDウェブサイトにアクセスして、無料のトライアルアカウントを作成します
2. ビデオの作成ボタンを選択して、新しいビデオの作成を開始します
3. Midjourneyの薬剤師の画像をプレゼンター画像として追加します
4. 右側にUpload your own voiceて、ChatGPTスクリプトオーディオをアップロードします。
1. 右上のGenerate Videoボタンをクリックして、傑作がダウンロードの準備が整うのを待ちます！