في مجال توليد الصور ، تقود تقنية توليد الصور متعددة الطبقات ثورة غيرت الطريقة التي يتفاعل بها المستخدمون مع النماذج التوليدية. تتيح هذه التقنية للمستخدمين عزل واختيار وتحرير طبقات صور محددة ، وبالتالي توفير حرية إبداعية غير مسبوقة. في الآونة الأخيرة ، أطلق فريق أبحاث Microsoft تقنية مبتكرة تسمى "مجهول المنطقة" (ART) ، والتي يمكنها إنشاء صور شفافة متعددة الطبقات مباشرة على أساس إشارات النص العالمية والتخطيطات الإقليمية المجهولة.

تصميم Art مستوحى من "نظرية المخطط" ، والتي تسمح للنموذج التوليدي بتحديد المعلومات المرئية التي تتوافق مع المعلومات النصية من خلال تبني تخطيط إقليمي مجهول. يتناقض هذا النهج بشكل حاد مع التصميم الدلالي التقليدي. تتطلب التخطيطات الدلالية التقليدية عادة مراسلات واضحة ، في حين أن تخطيط المنطقة المجهول في ART يوفر مرونة أكبر ، مما يجعل عملية التوليد أكثر ذكاءً وكفاءة.
تجدر الإشارة إلى أن Art يقدم آلية زراعة في منطقة الطبقات ، والتي تختار فقط المعلومات المرئية المتعلقة بكل منطقة مجهولة ، مما يقلل بشكل كبير من تكلفة حساب الانتباه. لا تسرع هذه الطريقة سرعة التوليد فحسب ، مما يجعلها أسرع أكثر من 12 مرة من طريقة الاهتمام الكامل ، ولكنها تقلل أيضًا بشكل فعال من النزاعات بين الطبقات ويمكنها التعامل مع توليد الصور بأكثر من 50 مستوى مختلفًا. توفر قدرة المعالجة الفعالة هذه دعمًا قويًا لمهام توليد الصور المعقدة.
بالإضافة إلى ذلك ، اقترح ART أيضًا مشفرًا تلقائيًا متعدد الطبقات عالي الجودة والذي يدعم شفافية الصور متعددة الطبقات المتغيرة المشفرة مباشرة وفك تشفيرها بطريقة مشتركة. يوفر هذا التصميم المبتكر إمكانيات جديدة للتحكم الدقيق وتوليد الطبقة القابلة للتطوير ، مما يؤدي إلى زيادة تطوير إنشاء المحتوى التفاعلي. من خلال هذه التقنية ، يمكن للمستخدمين التحكم في جميع مستويات الصور بشكل أكثر مرونة وتحقيق المزيد من التحرير والإنشاء.
المشروع: https://art-msra.github.io/
النقاط الرئيسية:
يمكن للفن إنشاء صور شفافة متعددة الطبقات مباشرة بناءً على مطالبات النص العالمي والتخطيط الإقليمي المجهول.
تم اعتماد آلية زراعة منطقة الطبقات على أساس لتحسين كفاءة توليد الصور بشكل كبير ، والتي هي أسرع 12 مرة من الطريقة التقليدية.
يدعم Autoencoder الجديد عالي الجودة التحكم الدقيق وتوليد الصور الشفافة متعددة الطبقات ، مما يعزز إنشاء المحتوى التفاعلي.