Bytedanceは最近、InfiniteYou(INFU)と呼ばれる画像生成ツールを発売しました。このツールのコア機能は、テキストの説明を個人のアイデンティティ特性を持つ高品質の画像に変換することです。従来の顔を変えるアプリケーションとは異なり、InfiniteYouはシーンやコンテンツを柔軟に変更するだけでなく、ユーザーのID特性を正確に保持するため、生成された画像は説明と高度にパーソナライズされたものと一致します。

InfiniteYouのコアはInfusenetです。これは、ユーザーIDの特性を拡散トランス(DIT)の高度な画像生成モデルに注入できる技術です。 「残留接続」の微細な操作を通じて、Infusenetは元の生成能力を破壊し、顔の類似性を高め、それによって高品質の画像生成を達成します。
さらに、InfiniteYouのR&Dプロセスは、合成シングルパーソンマルチサンプル(SPMS)データを使用して、トレーニング前および監視付き微調整(SFT)を含むマルチステージトレーニングを受けました。この洗練されたトレーニング戦略は、テキストと画像の整合を大幅に改善し、生成された画像をテキストの説明に沿ってより一致させ、同時に画像の品質と美学を改善し、「顔の変化」後の一般的な顔のコピーパステの問題を効果的に緩和します。
Bytedanceは、AES_STAGE2とSIM_STAGE1の2つのモデルバージョンもリリースし、それぞれテキストと画像のアライメントと顔の類似性に焦点を当てています。ユーザーは、ニーズに応じて適切なバージョンを選択できます。比較実験を通じて、InfiniteYouは、ID.1-DEV IP-AdapterやPulid-Fluxなどのアイデンティティの類似性、テキスト画像のアライメント、画質、美学の観点から既存の高度な方法を上回ります。
InfiniteYouには「プラグアンドプレイ」機能もあり、さまざまなフラックス、1-devバリアント、コントロールネット、ロラ、その他の既存のツールとシームレスに統合でき、より強力な制御可能性とカスタマイズ機能を提供します。この強力な互換性は、より広いコミュニティに貴重な貢献をするでしょう。
InfiniteYouは現在、Creative Commons Attribution-NonCommercial4.0 International Public Licenseに基づいてリリースされており、学術研究専用であることに注意する必要があります。関連するモデルのダウンロードと使用(InsightfaceのFaceモデル、Flux.1-Devベースモデル、LORAなど)は、元の許可を遵守する必要があります。同時に、開発者は、ユーザーが地域の法律や規制を順守し、この技術を責任を持って使用し、潜在的な虐待を回避できることを望んでいます。
プロジェクトの入り口:https://top.aibase.com/tool/infiniteyou