최신 생성 AI 도구를 테스트에 올려 놓고, 나는 약물 상담을 현실적이고 전문적인 소리로 전달할 수있는이 애니메이션 아바타를 만들었습니다.
️ 면책 조항 :이 비디오는 개인 취미 프로젝트의 일부로서의 데모 목적으로 순전히 의학적 조언을 제공하기위한 것이 아닙니다. 이것은 실제 제품이 아니며, 표현 된 견해는 내 자신입니다.
아래의 축소판을 클릭 하거나이 링크를 방문하십시오 (이 링크를 방문) 데모 비디오를 보려면 메이시가 실제로 설명되는 두 가지 약물에 대해 간단히 이야기합니다.
생성 AI가 개선되는 속도를 감안할 때 결과는 매우 인상적이며 시간이 지남에 따라 더 나아질 것입니다. 이 데모를 만들려면 0 달러와 25 분이 걸렸습니다.
내가 사용한 도구는 다음과 같습니다.
아바타를 대표하려면 얼굴이 필요하며 Midjourney와 같은 이미지 생성 도구를 사용하여 바로 그 일을 할 수 있습니다.
Midjourney는 OpenAi의 무료 AI 서비스입니다. 텍스트 설명에서 이미지를 만듭니다.
설정:
newbies-24 
/imagine 입력 한 다음 설명 프롬프트가 이어집니다. 예를 들어, 내가 사용한 프롬프트는 "약국 배경을 가진 흰색 실험실 코트에서 여성 중국 약사의 고품질 상체 전문 사진"이었습니다. 입력 한 후 Enter를 누르고 MidJourney에 이미지를 생성 할 시간을주십시오. 


또한 Dall-E 및 안정적인 확산과 같은 다른 도구를 시도했지만 결과는 현실적이지 않았습니다 (예 : 잘못 정렬 된 눈 및 얼굴 특징).
참고 : Midjourney는 2023 년 4 월 현재 무료 평가판 프로그램을 일시 중지했습니다. 현실적인 얼굴 사진을 생성하려면 다음 중 하나를 사용할 수 있습니다.
우리는 약물 세트에 대한 관련 조언을 제공 할 수있는 상담 스크립트가 필요합니다. 그렇게하려면 chatgpt를 사용할 수 있습니다.
Chatgpt는 OpenAi가 개발하고 2022 년 11 월에 시작된 챗봇입니다. OpenAI의 GPT-3 대형 언어 모델 제품군 위에 세워졌습니다.
설정:

출력 중 일부가 지나치게 이론적이고 학업적인 것으로 나타 났기 때문에 반응을 여러 번 재생해야했으며 환자에게 약물을 설명하기 위해 예상되는 평신도 형식이 아닙니다.
다음으로 Chatgpt 스크립트 텍스트를 자연스러운 사운드 오디오 클립으로 변환하려고합니다. Prime Voice AI와 같은 무료 도구 (ElevenLabs)와 같은 무료 도구로 그렇게 할 수 있습니다.
Prime Voice AI는 현실적이고 다재다능한 AI 스피치 소프트웨어로 스토리 텔링을위한 최고의 도구를 찾고있는 제작자와 출판사에게 가장 매력적이고 풍부하며 생생한 목소리를 제공합니다.
설정:
premade/Domi 였습니다. 안정성과 선명도와 같은 것에 따라 설정을 조정할 수도 있습니다. 
데모가 너무 길어지기를 원하지 않았기 때문에 Amlodipine의 섹션을 제거하여 스크립트를 약간 단축했습니다.
무료 계정에는 신용 한도가 있으므로 생성하려는 오디오에 현명하게 사용하십시오.
로컬 컴퓨터에서 .mp3 ( 'synthesized_audio.mp3') 파일을 다운로드하여 저장하십시오.
보너스 팁 : ElevenLabs에는 음성 실험실 기능 아래) : https://beta.elevenlabs.io/voice-lab도 함께 제공됩니다. 특정 음성의> 1 분 녹음이있는 경우 스크립트를 클론하려는 음성으로 변환 할 수 있습니다.
마지막으로, 약사 이미지를 조각하고 오디오 상담 오디오를 함께 사진을 찍을 시간입니다. 이를 위해 D-ID와 같은 도구를 사용할 수 있습니다.
D-ID의 Creative AI 기술은 얼굴의 이미지를 가져 와서 고품질의 사진 학적 비디오로 바꿉니다. 버튼을 클릭하면 이미지를 오디오 또는 텍스트와 결합하여 표현과 음성을 제공 할 수 있습니다.
설정:
Upload your own voice 에 ChatGpt 스크립트 오디오를 업로드하십시오. 
Generate Video 버튼을 클릭하고 걸작이 다운로드 될 때까지 기다리십시오!