حرصًا على وضع أحدث أدوات الذكاء الاصطناعي للاختبار ، قمت بإنشاء صورة رسومية متحركة قادرة على تقديم المشورة الدوائية بطريقة واقعية ومهنية.
️ إخلاء المسئولية: هذا الفيديو محض لأغراض تجريبية كجزء من مشروع هواية شخصية ولا يهدف إلى تقديم أي شكل من أشكال المشورة الطبية. هذا ليس منتجًا حقيقيًا ، ووجهات النظر التي يتم التعبير عنها هي الخاصة بي.
انقر فوق الصورة المصغرة أدناه (أو قم بزيارة هذا الرابط) لمشاهدة الفيديو التجريبي لمشاهدة Macy في العمل ، حيث تتحدث بإيجاز عن أدويين موصوفين بشكل شائع.
النتيجة مثيرة للإعجاب إلى حد ما ولن تتحسن إلا مع مرور الوقت ، بالنظر إلى السرعة التي تتحسن بها الذكاء الاصطناعي التوليدي. لإنشاء هذا العرض التوضيحي ، استغرق الأمر مني 0 دولارات و 25 دقيقة فقط.
فيما يلي الأدوات التي استخدمتها:
نحتاج إلى وجه لتمثيل الصورة الرمزية الخاصة بنا ، ويمكننا استخدام أدوات توليد الصور مثل Midjourney للقيام بذلك
Midjourney هي خدمة AI مجانية من Openai تنشئ صورًا من أوصاف نصي
يثبت:
newbies-24 
/imagine تليها موجه الوصف. على سبيل المثال ، كانت المطالبة التي استخدمتها هي "الصورة المهنية عالية الجودة عالية الجودة للصيادلة الصينية في معطف مختبر أبيض مع خلفية صيدلية". اضغط على Enter بعد كتابته ، وقم بإعطاء Midjourney بعض الوقت لإنشاء الصور. 


لقد جربت أيضًا أدوات أخرى مثل Dall-E والانتشار المستقر ولكن نتائجها لم تكن واقعية بما يكفي (على سبيل المثال ، عيون غير محسوبة وميزات الوجه).
ملاحظة : أوقفت Midjourney برنامجها التجريبي المجاني اعتبارًا من أبريل 2023. لتوليد صور واقعية للوجه ، يمكنك استخدام أي مما يلي:
نحتاج إلى نص مشورة يمكن أن يقدم المشورة ذات الصلة بشأن مجموعة من الأدوية. للقيام بذلك ، يمكننا استخدام chatgpt.
ChatGPT هو chatbot تم تطويره بواسطة Openai وتم إطلاقه في نوفمبر 2022. تم تصميمه على قمة عائلة GPT-3 من Openai من نماذج اللغة الكبيرة.
يثبت:

اضطررت إلى تجديد الاستجابة عدة مرات لأنني وجدت أن بعض الناتج نظريًا وأكاديميًا بشكل مفرط ، وليس بتنسيق الشخص العادي المتوقع لشرح الأدوية للمرضى.
بعد ذلك ، نريد تحويل نص ChatGpt Script إلى مقطع صوتي طبيعي. يمكننا القيام بذلك باستخدام أدوات مجانية مثل Prime Voice AI (بواسطة Elevenlabs)
يعد Prime Voice AI برنامجًا واقعيًا ومتعدد الاستخدامات من الذكاء الاصطناعي يجلب الأصوات الأكثر إقناعًا وغنيًا وشبيهة بالحياة للمبدعين والناشرين الذين يبحثون عن الأدوات النهائية لرواية القصص.
يثبت:
premade/Domi كما وجدت أنه الأكثر حيوية وطبيعية. يمكن أيضًا تعديل الإعدادات وفقًا لأشياء مثل الاستقرار والوضوح. 
لقد قمت باختصار السيناريو قليلاً عن طريق إزالة القسم الموجود على أموديبين المخدرات لأنني لم أكن أريد أن يكون العرض التوضيحي طويلًا جدًا.
يوجد حد ائتمان للحساب المجاني ، لذا تأكد من استخدامه بحكمة للصوت الذي تريد إنشاءه.
قم بتنزيل وحفظ ملف .mp3 (بعنوان "Synthesized_audio.mp3 ') على جهازك المحلي.
نصيحة المكافأة: يأتي Elevenlabs أيضًا مع إمكانات الاستنساخ الصوتي (تحت ميزة Voice Lab): https://beta.elevenlabs.io/voice-lab. إذا كان لديك> 1 دقيقة تسجيل صوت معين ، فيمكنك تحويل البرنامج النصي إلى الصوت الذي تريد استنساخه.
أخيرًا ، لقد حان الوقت لتجميع صورة الصيدلي وتقديم المشورة معًا في فيديو واقعية. للقيام بذلك ، يمكننا استخدام أدوات مثل D-ID.
تلتقط تقنية D-ID الإبداعية صورًا للوجوه وتحولها إلى مقاطع فيديو عالية الجودة واقعية. بنقرة زر واحدة ، يمكن أن يجمع بين الصور مع الصوت أو النص لمنحهم التعبير والكلام.
يثبت:
Upload your own voice على اليمين. 
Generate Video في أعلى اليمين وانتظر حتى تكون تحفة تحفة جاهزة للتنزيل!