กระตือรือร้นที่จะนำเครื่องมือ AI รุ่นล่าสุดมาทดสอบฉันได้สร้างอวตารอนิเมชั่นนี้สามารถให้คำปรึกษาด้านการใช้ยาในลักษณะที่เป็นจริงและเป็นมืออาชีพ
ข้อจำกัดความรับผิดชอบ: วิดีโอนี้มีวัตถุประสงค์เพื่อการสาธิตอย่างหมดจดซึ่งเป็นส่วนหนึ่งของโครงการงานอดิเรกส่วนตัวและไม่ได้มีไว้เพื่อให้คำแนะนำทางการแพทย์ในรูปแบบใด ๆ นี่ไม่ใช่ผลิตภัณฑ์จริงและมุมมองที่แสดงเป็นของฉันเอง
คลิกรูปขนาดย่อด้านล่าง (หรือเยี่ยมชมลิงค์นี้) เพื่อดูวิดีโอสาธิตเพื่อดู Macy In Action ซึ่งเธอพูดสั้น ๆ เกี่ยวกับยาสองชนิดที่ระบุโดยทั่วไป
ผลลัพธ์นั้นค่อนข้างน่าประทับใจและจะดีขึ้นเมื่อเวลาผ่านไปเนื่องจากความเร็วที่ AI Generative กำลังดีขึ้น ในการสร้างตัวอย่างนี้ฉันใช้เวลา 0 ดอลลาร์และเพียง 25 นาที
นี่คือเครื่องมือที่ฉันใช้:
เราต้องการใบหน้าเพื่อเป็นตัวแทนของอวตารของเราและเราสามารถใช้เครื่องมือสร้างภาพเช่น Midjourney เพื่อทำเช่นนั้น
Midjourney เป็นบริการ AI ฟรีโดย Openai ที่สร้างภาพจากคำอธิบายข้อความ
การตั้งค่า:
newbies-24 
/imagine ตามด้วยพรอมต์คำอธิบายของคุณ ตัวอย่างเช่นพรอมต์ที่ฉันใช้คือ "ภาพถ่ายมืออาชีพด้านบนที่มีคุณภาพสูงของเภสัชกรหญิงสาวหญิงในเสื้อโค้ทห้องแล็บสีขาวที่มีพื้นหลังร้านขายยา" กด Enter หลังจากพิมพ์และให้ Midjourney สักครู่เพื่อสร้างภาพ 


ฉันยังลองใช้เครื่องมืออื่น ๆ เช่น Dall-E และการแพร่กระจายที่เสถียร แต่ผลลัพธ์ของพวกเขาไม่สมจริงเพียงพอ (เช่นดวงตาที่ไม่ตรงแนวและคุณสมบัติใบหน้า)
หมายเหตุ : Midjourney ได้หยุดโปรแกรมทดลองใช้ฟรี ณ เดือนเมษายนปี 2023 เพื่อสร้างภาพใบหน้าที่สมจริงคุณสามารถใช้อย่างใดอย่างหนึ่งต่อไปนี้:
เราต้องการสคริปต์การให้คำปรึกษาที่สามารถให้คำแนะนำที่เกี่ยวข้องกับชุดยา ในการทำเช่นนั้นเราสามารถใช้ CHATGPT
Chatgpt เป็นแชทบ็อตที่พัฒนาโดย OpenAI และเปิดตัวในเดือนพฤศจิกายน 2565 มันถูกสร้างขึ้นบนรุ่น GPT-3 ของ OpenAI ของโมเดลภาษาขนาดใหญ่ของ OpenAI
การตั้งค่า:

ฉันต้องสร้างการตอบสนองใหม่หลายครั้งเพราะฉันพบว่าผลผลิตบางอย่างเป็นทฤษฎีและวิชาการมากเกินไปและไม่ได้อยู่ในรูปแบบคนธรรมดาที่คาดหวังสำหรับการอธิบายยาให้กับผู้ป่วย
ต่อไปเราต้องการแปลงข้อความสคริปต์ CHATGPT เป็นคลิปเสียงที่เป็นธรรมชาติ เราสามารถทำได้ด้วยเครื่องมือฟรีเช่น Prime Voice AI (โดย Elevenlabs)
Prime Voice AI เป็นซอฟต์แวร์คำพูด AI ที่สมจริงและหลากหลายซึ่งนำเสียงที่น่าสนใจที่สุดร่ำรวยและมีชีวิตชีวาให้กับผู้สร้างและผู้จัดพิมพ์ที่กำลังมองหาเครื่องมือที่ดีที่สุดสำหรับการเล่าเรื่อง
การตั้งค่า:
premade/Domi เพราะฉันพบว่ามันมีชีวิตชีวาและเป็นธรรมชาติมากที่สุด การตั้งค่ายังสามารถปรับได้ตามความมั่นคงและความชัดเจน 
ฉันทำให้สคริปต์สั้นลงเล็กน้อยโดยการลบส่วนของยาแอมโลดิพีนยาเสพติดเพราะฉันไม่ต้องการให้การสาธิตยาวเกินไป
มีวงเงินเครดิตสำหรับบัญชีฟรีดังนั้นให้แน่ใจว่าคุณใช้อย่างชาญฉลาดสำหรับเสียงที่คุณต้องการสร้าง
ดาวน์โหลดและบันทึกไฟล์. mp3 (ชื่อ 'synthesized_audio.mp3') ไฟล์บนเครื่องท้องถิ่นของคุณ
เคล็ดลับโบนัส: Elevenlabs ยังมาพร้อมกับความสามารถในการโคลนเสียง (ภายใต้คุณสมบัติของ Voice Lab): https://beta.elevenlabs.io/voice-lab หากคุณมีการบันทึกเสียงที่เฉพาะเจาะจง> 1 นาทีคุณสามารถแปลงสคริปต์เป็นเสียงที่คุณต้องการโคลน
สุดท้ายก็ถึงเวลาที่จะนำภาพเภสัชกรและเสียงให้คำปรึกษาเข้าด้วยกันเป็นวิดีโอที่มีแสง ในการทำเช่นนั้นเราสามารถใช้เครื่องมือเช่น D-ID
เทคโนโลยี AI ที่สร้างสรรค์ของ D-ID ถ่ายภาพใบหน้าและเปลี่ยนเป็นวิดีโอคุณภาพสูง เมื่อคลิกเพียงปุ่มเดียวมันสามารถรวมรูปภาพเข้ากับเสียงหรือข้อความเพื่อให้นิพจน์และคำพูด
การตั้งค่า:
Upload your own voice ทางด้านขวา 
Generate Video ที่ด้านบนขวาและรอผลงานชิ้นเอกของคุณพร้อมสำหรับการดาวน์โหลด!