Цель этого проекта-изучить потенциальное использование крупных языковых моделей для улучшения текущего состояния современных моделей текста до изображения, таких как стабильная диффузия.
Написание оптимальных текстовых подсказок для наилучшего направления модели текста к изображению к желаемому результату может быть сложной задачей, часто требующей использования, казалось бы, произвольных ключевых слов и различных модификаторов стиля.
Сильное использование этих модификаторов является обычной практикой среди опытных пользователей из -за их частого положительного влияния на субъективное эстетическое качество, а также их способность генерировать изображения, более тесно выровненные с желаемым результатом. Даже тонкие изменения в размещении слов могут оказать существенное влияние, создавая потенциально ненужную работу даже для самых опытных писателей.
Учитывая эту сложность и отсутствие интуитивности, быстрый ввод в качестве пользовательского интерфейса для моделей текста до изображения в настоящее время не идеально.
Этот проект в настоящее время находится на исследовательской фазе. Мы приветствуем любые отзывы сообщества и хотели бы обсудить потенциальные предложения с любым, заинтересованным в проекте. Проверьте вкладку «Дискуссии», чтобы начать.
| Имя | Описание | Статус |
|---|---|---|
| Первоначальный эксперимент | Расширить подробные детали с помощью LLM | Полный |
| Обученная модель «бездействия» | Обучить модель для «беззакония» подсказок | Обратная связь запрашивала |