Generator gambar intranet
Saya ingin menunjukkan kepada keluarga saya apa yang saya lakukan untuk mencari nafkah dan cara apa yang lebih baik untuk membuat visi komputer menarik daripada model difusi?
Saya bisa saja menunjukkan kepada mereka Dall-E 2, Midjourney, atau juta aplikasi seluler yang dibangun di atas SD yang sudah ada di luar sana, namun jika saya membangunnya sendiri maka saya dapat menjalankannya secara gratis dan mempertahankan kontrol ujung-ke-ujung atas semua aspek, misalnya model yang saya gunakan, kemungkinan untuk menambahkan kontrol orang tua ke prompt, dll.
Jadi, saya membangun:
- Aplikasi seluler asli bereaksi sederhana sebagai frontend, yang mengambil prompt sebagai input dan menampilkan gambar yang dihasilkan
- Backend Python, dengan API berbasis Flask dan model difusi yang menjalankan inferensi pada GPU RTX 3090, dengan rencana untuk memuat menggunakan Docker
Bekerja sedang berlangsung!
Cara kerjanya:



Mendirikan:
- Variabel lingkungan pada backend (misalnya dalam file .env)
- HF_KEY: Kunci API Wajah Pelukan Anda
- Img_dir_win dan img_dir_docker: lokasi untuk menyimpan gambar yang dihasilkan
- Prompt_prefix dan prompt_suffix: opsional, jika Anda ingin awalan atau sufiks prompt dengan apa pun (misalnya kartun, ramah anak)
- Negatif_prompt: Opsional, tetapi harus digunakan untuk kontrol orang tua (misalnya menambahkan "menakutkan" untuk mencegah konvergensi pada gambar yang menakutkan, sama dengan konsep NSFW, dll.)
- Model_id: Opsional, memeluk ID model wajah, menggunakan SD 2.1 jika tidak ditentukan
Atur alamat IP LAN tetap pada mesin yang menjalankan backend dan ekspos port 5000 ke intra net Anda
Siapkan alamat IP backend pada aplikasi seluler di bawah menu Kebab (cari ⋮ di sudut kanan atas)
Sampai sekarang, untuk menjalankan aplikasi seluler, Anda perlu mengatur lingkungan pengembangan asli React, menyusun aplikasi dari sumber dan memuat .apk ke perangkat Android menggunakan mode pengembang.
Berikut adalah panduan yang praktis: https://reactnative.dev/docs/environment-setup?guide=native
Masalah dan Penafian yang Diketahui:
- Ini adalah prototipe hobi yang membutuhkan sedikit keterampilan teknologi untuk mulai bekerja dan tidak siap produksi. Anda tidak boleh menggunakannya jika Anda tidak memahami teknologi yang terlibat.
Baca persyaratan lisensi, terutama bagian 5 - penafian jaminan dan batasan pertanggungjawaban. - Saya tidak bisa menguji apakah Docker bekerja sama sekali, karena driver nvidia saya tidak ingin bermain dengan Docker di subsistem Windows Linux saya
- Aplikasi seluler masih memiliki ikon Android default dan bernama "Mobile_Client"
- Keamanan minimal (tidak melakukan upaya untuk membersihkan input atau mengotentikasi klien), backend hanya dimaksudkan untuk digunakan di belakang router NAT untuk tujuan demo, tidak siap untuk terpapar ke internet.
- Saya merekomendasikan untuk menyiapkan prompt negatif yang luas sebagai kontrol orang tua, selain menggunakan filter keamanan stabilitas, dan tidak membiarkan anak-anak bermain dengan model difusi tanpa pengawasan orang dewasa, karena sebagian besar model ini akan menghasilkan konten yang tidak sesuai dengan usia dengan upaya minimal dan keingintahuan.
Lisensi:
Hak Cipta 2023, Jozsef Szalma
Lisensi Publik Internasional Creative Commons Atribution-NonCommercial 4.0 International
https://creativecommons.org/licenses/by-nc/4.0/legalcode