L'objectif de ce projet est d'explorer les utilisations potentielles de modèles de grands langues pour la tâche d'améliorer les modèles de texte à image à l'image actuels tels que la diffusion stable.
La rédaction d'invites de texte optimales pour guider au mieux un modèle de texte à l'image vers un résultat souhaité peut être une tâche complexe, nécessitant souvent l'utilisation de mots clés apparemment arbitraires et de divers modificateurs de style.
L'utilisation intensive de ces modificateurs est une pratique courante chez les utilisateurs expérimentés en raison de leur effet positif fréquent sur la qualité esthétique subjective, ainsi que leur capacité à générer des images plus étroitement alignées sur le résultat souhaité. Même des changements subtils dans le placement des mots peuvent avoir un effet significatif, créant un travail potentiellement inutile même pour les écrivains rapides les plus qualifiés.
Compte tenu de cette complexité et du manque d'intuitivité, une entrée rapide comme interface utilisateur pour les modèles de texte à l'image est actuellement loin d'être idéale.
Ce projet est actuellement en phase exploratoire. Nous nous félicitons de tous les commentaires de la communauté et nous aimerions discuter des propositions potentielles avec toute personne intéressée par le projet. Consultez l'onglet Discussions pour commencer.
| Nom | Description | Statut |
|---|---|---|
| Expérience initiale | Développez les détails rapides avec un LLM | Complet |
| Modèle formé de «non-rendement» | Former un modèle pour les invites «non simplifiées» | Commentaires demandés |