인트라넷 이미지 생성기
나는 가족을 위해 가족을 위해 무엇을하는지, 확산 모델보다 컴퓨터 비전을 흥미롭게 만드는 더 좋은 방법을 보여주고 싶습니까?
방금 Dall-E 2, Midjourney 또는 SD에 구축 된 백만 개의 모바일 앱을 이미 보여줄 수 있었지만 직접 구축하면 무료로 실행하고 모든 측면에 대한 엔드 투 엔드 제어를 유지할 수 있습니다.
그래서 나는 다음을 만들었습니다.
- 간단한 반응 기본 모바일 앱으로 프론트 엔드로 입력으로 프롬프트가 표시되고 생성 된 이미지를 표시합니다.
- 플라스크 기반 API와 RTX 3090 GPU에서 추론을 실행하는 확산 모델이있는 파이썬 백엔드, Docker를 사용하여 컨테이너즈를 계획하는 계획
진행중인 작업!
작동 방식 :



설정:
- 백엔드의 환경 변수 (예 : .env 파일의)
- HF_KEY : 포옹 페이스 API 키
- IMG_DIR_WIN 및 IMG_DIR_DOCKER : 생성 된 이미지를 저장하는 위치입니다
- prompt_prefix 및 prompt_suffix : 옵션, 당신이 무엇이든 프롬프트를 접두사 또는 접미사하려면 (예 : 만화, 어린이 친화적)
- Negade_Prompt : 선택 사항이지만 부모의 통제에 사용해야합니다 (예 : 무서운 이미지의 수렴을 방지하기 위해 "Scary"를 추가하여 NSFW 개념과 동일).
- model_id : 선택 사항, 안아는 얼굴 모델 ID, 정의되지 않은 경우 SD 2.1 사용
백엔드를 실행하는 기계에 고정 된 LAN IP 주소를 설정하고 포트 5000을 인트라 네트에 노출시킵니다.
Kebab 메뉴 아래 모바일 앱에서 백엔드의 IP 주소를 설정합니다 (오른쪽 상단에서 ⋮를 찾으십시오)
현재 모바일 앱을 실행하려면 React Native Development 환경을 설정하고 소스에서 앱을 컴파일 한 다음 개발자 모드를 사용하여 .apk를 Android 장치에로드해야합니다.
다음은 편리한 안내서입니다. https://reactnative.dev/docs/environment-setup?guide=native입니다
알려진 문제 및 면책 조항 :
- 이것은 일을하기 위해 약간의 기술 기술이 필요하고 생산 준비가되지 않는 취미 프로토 타입입니다. 관련된 기술을 이해하지 못하면 사용해서는 안됩니다.
라이센스 약관, 특히 섹션 5 - 보증 부인 및 책임 제한을 읽으십시오. - NVIDIA 드라이버가 Windows Linux 하위 시스템에서 Docker와 놀고 싶지 않기 때문에 Docker가 전혀 작동하는지 테스트 할 수 없었습니다.
- 모바일 앱에는 여전히 기본 안드로이드 아이콘이 있으며 "Mobile_Client"라고합니다.
- 최소 보안 (입력을 소독하거나 클라이언트를 인증하려는 시도가 아닌 경우, 백엔드는 인터넷에 노출 될 준비가되지 않은 데모 목적으로 NAT 라우터 뒤에서만 사용됩니다.
- 안정성 안전 필터를 사용하는 것 외에도 부모 통제로 광범위한 네거티브 프롬프트를 설정하는 것이 좋습니다. 이 모델의 대부분은 최소한의 노력과 호기심으로 연령에 맞지 않는 콘텐츠를 생성 할 수 있기 때문에 아이들이 성인 감독없이 확산 모델을 사용하지 않도록하는 것이 좋습니다.
특허:
저작권 2023, Jozsef Szalma
Creative Commons Attribution-Noncommercial 4.0 국제 공공 라이센스
https://creativecommons.org/licenses/by-nc/4.0/legalcode