استقرت AI ، وهي شركة معروفة بنماذج الصور التي تم توليد النصوص المستقرة للانتشار ، أطلقت مؤخرًا تعاونًا كبيرًا مع ARM Global Semiconductor Giant. الهدف من هذا التعاون هو تقديم تقنية منظمة العفو الدولية التي تنشئ الصوت إلى الأجهزة المحمولة ، مما يسمح لنموذج الصوت المفتوح المستقر بالكامل على وحدات المعالجة المركزية للذراع. هذا يعني أنه يمكن للمستخدمين إنشاء مؤثرات صوتية وعينات صوتية وعناصر الإنتاج مباشرة على الجهاز دون اتصال بالإنترنت ، مما يحسن بشكل كبير من الراحة وكفاءة الإنشاء.

يقول الثبات منظمة العفو الدولية أنه مع استخدام الذكاء الاصطناعي التوليدي على نطاق أوسع بين المؤسسات والمبدعين المحترفين ، يصبح من المهم بشكل خاص التأكد من استخدام هذه النماذج وسير العمل بسهولة في كل مجال إبداعي. هذا لا يحسن الكفاءة الإبداعية فحسب ، بل يساعد أيضًا في دمج هذه التقنيات بسلاسة في عملية إنتاج الوسائط البصرية ، وبالتالي دفع الابتكار والتطوير في جميع أنحاء الصناعة.
في مواجهة الطلب المتزايد ، تلتزم الاستقرار بمنظمة العفو الدولية لتحسين كفاءة نماذجها التي تعمل على أجهزة الحافة. في تحسين نموذج الصوت المفتوح المستقر لتناسب الأجهزة المحمولة ، أظهرت الاختبارات الأولية أن الوقت لإنشاء الصوت على جهاز وحدة المعالجة المركزية ARM وصل إلى 240 ثانية. ومع ذلك ، من خلال تقطير النموذج والاستفادة من برامج ARM ، وخاصة من خلال kernel int8 Matrix Multiplication في Kleidiai من Xnnpack ، قامت الشركة بنجاح بتقليل الوقت لتوليد مقطع صوتي مدته 11 ثانية إلى 8 ثوانٍ ، مما حقق زيادة في سرعة الاستجابة 30 مرة في الاستجابة.
تجدر الإشارة إلى أن المستخدمين يحتاجون إلى جهاز محمول متوافق لتجربة هذه الميزة. بالنظر إلى أن معظم الهواتف الذكية مجهزة الآن بوحدة المعالجة المركزية القائمة على الذراع ، أصبحت هذه التقنية أكثر سهولة لجميع أنواع المستخدمين. في المستقبل ، تخطط الاستقرار AI أيضًا لجلب جميع طرزها في مجالات الصور ومقاطع الفيديو وأجهزة ثلاثية الأبعاد إلى الحافة ، بهدف إحداث ثورة في الطريقة التي يتم بها إنشاء الوسائط المرئية على الأجهزة المحمولة وجلب المستخدمين تجربة إبداعية أكثر ثراءً وأكثر ملاءمة.
النقاط الرئيسية:
الاستقرار AI شراكة مع ARM لإطلاق التكنولوجيا التي تولد الصوت دون اتصال على الأجهزة المحمولة.
من خلال تقطير النموذج وتحسين البرامج ، يتم تقصير وقت توليد الصوت من 240 ثانية إلى 8 ثوان ، ويتم زيادة الكفاءة بمقدار 30 مرة.
يمكن استخدام هذه التقنية على معظم الهواتف الذكية المجهزة بوحدة المعالجة المركزية للذراع وستتوسع إلى المزيد من إنشاء الوسائط في المستقبل.