A Bytedance lançou recentemente uma ferramenta de geração de imagens chamada Infinite You (INFU), a função principal dessa ferramenta é transformar as descrições de texto em imagens de alta qualidade com características de identidade pessoal. Diferentemente dos aplicativos tradicionais de mudança de rosto, o Infinite, você pode não apenas alterar as cenas e o conteúdo de flexibilidade, mas também manter com precisão as características de identidade do usuário, para que as imagens geradas sejam consistentes com a descrição e altamente personalizadas.

O núcleo do Infinite You é o InfuseNet, uma tecnologia que pode injetar características de identidade do usuário no modelo avançado de geração de imagens do transformador de difusão (DIT). Através da boa operação de "conexão residual", o Infusenet não destrói a capacidade de geração original e, ao mesmo tempo, aumenta a similaridade do rosto, alcançando assim a geração de imagens de alta qualidade.
Além disso, o processo de P&D da Infiniteyou passou por treinamento em vários estágios, incluindo pré-treinamento e ajuste fino (SFT) usando dados de múltiplas amostras sintéticas de várias amostras (SPMS). Essa estratégia de treinamento refinada melhora significativamente o alinhamento de texto e imagens, tornando as imagens geradas mais alinhadas com a descrição do texto e, ao mesmo tempo, melhora a qualidade e a estética da imagem, aliviando efetivamente os problemas comuns de cola facial após "mudança de face".
A Bytedance também lançou duas versões do modelo: AES_STAGE2 e SIM_STAGE1, concentrando -se no alinhamento de texto e imagem e similaridade enfrentada, respectivamente. Os usuários podem escolher a versão apropriada de acordo com suas necessidades. Através de experimentos comparativos, o Infinite você supera os métodos avançados existentes em termos de similaridade de identidade, alinhamento de imagem de texto, qualidade da imagem e estética, como fluxo.1-devador IP e fluxo de pulidores.
O Infinite, você também possui o recurso "Plug and Play", que pode se integrar perfeitamente a várias variantes de fluxo. Essa forte compatibilidade fará uma contribuição valiosa para a comunidade em geral.
Deve-se notar que o Infinite You é atualmente lançado com base em Licença Pública Creative Commons Attribution-NonCommercial4.0 e é apenas para pesquisa acadêmica. O download e o uso de modelos relacionados (como o modelo de rosto do Insightface, o Flux.1-Dev Base Model, Lora etc.) deve cumprir sua permissão original. Ao mesmo tempo, os desenvolvedores também esperam que os usuários possam cumprir as leis e regulamentos locais, usar essa tecnologia com responsabilidade e evitar qualquer abuso potencial.
Entrada do projeto: https://top.aibase.com/tool/infiniteyou