الهدف من هذا المشروع هو استكشاف الاستخدامات المحتملة لنماذج اللغات الكبيرة لمهمة تحسين النماذج الحالية من النص إلى الصورة مثل الانتشار المستقر.
يمكن أن تكون كتابة مطالبات النص الأمثل لتوجيه نموذج النص إلى الصورة نحو النتيجة المرغوبة مهمة معقدة ، وغالبًا ما تتطلب استخدام كلمات رئيسية تعسفية ومعدلات نمط مختلفة.
يعد الاستخدام الكثيف لهذه المعدلات ممارسة شائعة بين المستخدمين ذوي الخبرة بسبب تأثيرهم الإيجابي المتكرر على الجودة الجمالية الذاتية ، وكذلك قدرتهم على توصيل الصور بشكل أوثق مع النتيجة المرجوة. حتى التغييرات الدقيقة في وضع الكلمات يمكن أن يكون لها تأثير كبير ، مما يخلق عملًا غير ضروري حتى لأكثر الكتاب المطالبين المهرة.
بالنظر إلى هذا التعقيد وعدم وجود حدسيات ، فإن الإدخال السريع كواجهة مستخدم لنماذج النص إلى الصورة أقل من مثالية.
هذا المشروع حاليا في المرحلة الاستكشافية. نرحب بأي ردود الفعل من المجتمع ونود مناقشة المقترحات المحتملة مع أي شخص مهتم بالمشروع. تحقق من علامة التبويب مناقشات للبدء.
| اسم | وصف | حالة |
|---|---|---|
| التجربة الأولية | توسيع التفاصيل السريعة مع LLM | مكتمل |
| نموذج "عدم التصرف" المدربين | تدريب نموذج على مطالبات "لا يتصرف" | طلب التعليقات |