Tujuan dari proyek ini adalah untuk mengeksplorasi potensi penggunaan model bahasa besar untuk tugas meningkatkan keadaan saat ini dari model teks-ke-gambar seni seperti difusi yang stabil.
Menulis permintaan teks yang optimal untuk memandu model teks-ke-gambar terbaik menuju hasil yang diinginkan dapat menjadi tugas yang kompleks, seringkali membutuhkan penggunaan kata kunci yang tampaknya sewenang-wenang dan berbagai pengubah gaya.
Penggunaan berat dari pengubah ini adalah praktik umum di antara pengguna yang berpengalaman karena efek positif mereka yang sering pada kualitas estetika subyektif, serta kemampuan mereka untuk menghasilkan gambar yang lebih dekat dengan hasil yang diinginkan. Bahkan perubahan halus dalam penempatan kata dapat memiliki efek yang signifikan, menciptakan pekerjaan yang berpotensi tidak perlu bahkan untuk penulis cepat yang paling terampil.
Mengingat kompleksitas ini dan kurangnya intuitif, input cepat sebagai UI untuk model teks-ke-gambar saat ini kurang dari ideal.
Proyek ini saat ini sedang dalam fase eksplorasi. Kami menyambut setiap dan semua umpan balik dari komunitas dan ingin membahas proposal potensial dengan siapa pun yang tertarik dengan proyek tersebut. Lihat tab Diskusi untuk memulai.
| Nama | Keterangan | Status |
|---|---|---|
| Eksperimen Awal | Perluas detail cepat dengan LLM | Menyelesaikan |
| Model "tidak direksapi" terlatih | Latih model untuk "tidak masuk akal" meminta | Umpan balik diminta |