Jaringan ringan yang mengontrol informasi spasial difusi stabil menggunakan fine-tuning Cina
Dalam bahasa Inggris
Controllora adalah rekayasa yang menggunakan teknologi LORA untuk hanya men -debug difusi stabil untuk mengendalikan informasi spasialnya. Secara umum, jaringan sederhana dan kecil digunakan (~ parameter 7m, ~ 25m penyimpanan). Informasi lebih lanjut tersedia dari Controllora.
Proyek ini dapat dianggap sebagai garpu controllora. Dan dua ladang Cina diberikan berdasarkan metode controllora.
Anda dapat menggunakan ruang huggingface online untuk mengunggah gambar Anda dan teks cepat Cina untuk melihat hasil output. Karena digunakan dan digunakan pada CPU, saya sarankan Anda mengunduh proyek -proyek ini secara lokal dan menjalankannya menggunakan GPU Anda. (Karena pengaturan "is_available", itu secara dinamis akan mengganti perangkat berdasarkan apakah ada GPU)
| nama | Tautan Model Huggingface | Link Space Huggingface |
|---|---|---|
| ControlNet oleh Canny Chinese? | https://huggingface.co/svjack/canny-control-lora-zh | https://huggingface.co/spaces/svjack/controlnet-canny-chinese |
| Controlnet dengan pose cina? | https://huggingface.co/svjack/pose-control-lora-zh | https://huggingface.co/spaces/svjack/controlnet-pose-chinese |
pip install -r requirements.txtSetelah instalasi, Anda dapat CD ke ControlNet-Canny-Chinese dan ControlNet-Pose-Chinese untuk dijalankan secara terpisah
python app.pyBuka browser Anda dan buka http: // localhost: 7860 untuk bereksperimen di browser.
| Nama | Mengingatkan | Gambar asli | Gambar tulang punggung | Gambar yang diubah |
|---|---|---|---|---|
| ControlNet oleh Canny Chinese? | Badut yang menyenangkan | ![]() | ![]() | ![]() |
| ControlNet oleh Canny Chinese? | Malam penuh dengan meteor | ![]() | ![]() | ![]() |
| ControlNet oleh Canny Chinese? | Vampir Kucing | ![]() | ![]() | ![]() |
| Controlnet dengan pose cina? | Wheat Field Watcher | ![]() | ![]() | ![]() |
| Controlnet dengan pose cina? | Perwira militer berseragam militer | ![]() | ![]() | ![]() |
Lora: Adaptasi rendah dari model bahasa besar Lora mengurangi jumlah parameter pelatihan dengan mempelajari pasangan matriks dekomposisi peringkat dan membekukan bobot asli. Ini sangat mengurangi keterbatasan penyimpanan dari fine-tuning tugas hilir dan pengalihan tugas oleh model besar, membuka potensi inferensi saat digunakan. Lora juga melampaui banyak model penyesuaian lainnya (seperti adaptor, tuning awalan, dan penyesuaian)
Di bidang difusi yang stabil, saya juga menyediakan 3 model difusi stabil yang disempurnakan menggunakan LORA. Dataset CC3M diunduh dan dikonversi oleh svJack/img2dataset-pq2hf-transform-toolkit.
| nama | Tautan Model Huggingface | bahasa | Menyempurnakan dataset |
|---|---|---|---|
| svjack/pokemon-sd-lora-zh | https://huggingface.co/svjack/pokemon-sd-lora-zh | Cina | svJack/pokemon-blip-captions-en-zh |
| svJack/konsep-caption-3m-sd-lora-en | https://huggingface.co/svjack/concept-caption-3m-sd-lora-en | Bahasa inggris | Keterangan Konseptual (CC3M) |
| SVJJACK/KONSEP-CAPTION-3M-SD-LORA-ZH | https://huggingface.co/svjack/concept-caption-3m-sd-lora-zh | Cina | Keterangan Konseptual (CC3M) |
Anda dapat menemukan cara menggunakan model ini melalui kartu model.
svjack - [email protected] - [email protected]
Tautan Proyek: https: //github.com/svjack/controllora-chinese