PreTTI
1.0.0
このプロジェクトの目標は、安定した拡散などの最新のテキストから画像モデルを改善するタスクのための大規模な言語モデルの潜在的な使用を調査することです。
最適なテキストを作成すると、テキストから画像へのモデルを最適に希望する結果に向けて最適に導くことが複雑なタスクであり、多くの場合、一見任意のキーワードとさまざまなスタイルの修飾子を使用する必要があります。
これらの修飾子を大量に使用することは、主観的な美的品質に頻繁にプラスの効果をもたらすことと、望ましい結果とより密接に整合する画像を生成する能力のために、経験豊富なユーザーの間で一般的な慣行です。単語配置の微妙な変化でさえ大きな効果をもたらす可能性があり、最も熟練した迅速な作家でさえ、潜在的に不必要な作業を生み出します。
この複雑さと直感性の欠如を考えると、テキストから画像へのモデルのUIとしての迅速な入力は現在、理想よりも少ないです。
このプロジェクトは現在、探索的段階にあります。コミュニティからのすべてのフィードバックを歓迎し、プロジェクトに興味のある人と潜在的な提案を議論したいと思います。 [ディスカッション]タブをご覧ください。
| 名前 | 説明 | 状態 |
|---|---|---|
| 初期実験 | LLMを使用して詳細を拡大します | 完了 |
| トレーニングされた「不足していない」モデル | モデルをトレーニングして、プロンプトを「単純化しない」ようにします | リクエストされたフィードバック |