イントラネット画像ジェネレーター
私は家族に私が生計を立てるために何をしているのか、そして拡散モデルよりもコンピュータービジョンを面白くするためのより良い方法を見せたかったのですか?
Dall-E 2、Midjourney、またはすでにSDに構築された100万のモバイルアプリを既に構築したことを示すことができましたが、自分で構築した場合、それを無料で実行し、すべての側面、たとえば私が使用するモデル、親のコントロールをプロンプトに追加する可能性などをエンドツーエンドの制御を維持できます。
それで、私は構築しました:
- フロントエンドとしての単純なReactネイティブモバイルアプリは、入力としてプロンプトを取得し、生成された画像を表示します
- FlaskベースのAPIとRTX 3090 GPUで推論を実行している拡散モデルを備えたPythonバックエンド、Dockerを使用してコンテナ化する計画があります
進行中の作業!
それがどのように機能するか:



設定:
- バックエンドの環境変数(例えば、.ENVファイル)
- HF_KEY:あなたの抱きしめる顔APIキー
- IMG_DIR_WINおよびIMG_DIR_DOCKER:生成された画像を保存する場所
- PRONT_PREFIXおよびPRONT_SUFFIX:オプション、プロンプトに何かをプレフィックスまたは接尾辞にする場合(例:漫画風、子供に優しい)
- negial_prompt:オプションですが、親のコントロールに使用する必要があります(例えば、怖い画像の収束を防ぐために「怖い」を追加します。NSFWの概念と同じなど)
- model_id:オプション、抱きしめ、フェイスモデルIDを抱きしめ、定義されていない場合はSD 2.1を使用しています
バックエンドを実行しているマシンに固定LAN IPアドレスを設定し、ポート5000をネットに露出させます
kebabメニューの下にモバイルアプリにバックエンドのIPアドレスを設定します(右上隅の⋮を探します)
現在、モバイルアプリを実行するには、Reactネイティブ開発環境をセットアップし、ソースからアプリをコンパイルし、開発者モードを使用して.APKをAndroidデバイスにロードする必要があります。
便利なガイドです:https://reactnative.dev/docs/environment-setup?guide = native
既知の問題と免責事項:
- これは趣味のプロトタイプであり、仕事に取り掛かるためにかなりの技術スキルを必要とし、生産の準備ができていません。関係する技術を理解していない場合は、使用しないでください。
ライセンス条件、特にセクション5 - 保証の免責事項と責任の制限をお読みください。 - 私のnvidiaドライバーは私のWindows LinuxサブシステムでDockerと遊びたくないので、Dockerが動作するかどうかをテストできませんでした
- モバイルアプリにはまだデフォルトのAndroidアイコンがあり、「mobile_client」という名前があります。
- 最小限のセキュリティ(入力を消毒したり、クライアントを認証しようとする試みをしない)、バックエンドは、インターネットにさらされる準備ができていないデモの目的でNATルーターの背後に使用することを目的としています。
- これらのモデルのほとんどは、最小限の努力と好奇心で年齢不適切なコンテンツを生成するため、安定性安全フィルターを使用することではなく、安定性安全フィルターを使用しないことに加えて、親のコントロールとして広範なネガティブプロンプトを設定することをお勧めします。
ライセンス:
Copyright 2023、Jozsef Szalma
Creative Commons Attribution-NonCommercial 4.0国際公開ライセンス
https://creativecommons.org/licenses/by-nc/4.0/legalcode