O lançamento do Animagine XL 3.1, um modelo de texto para imagem com tema de anime de código aberto, marca um progresso significativo no campo da geração de imagens. Esta versão fez muitas otimizações para resolver as deficiências das versões anteriores, como resolver o problema de superexposição de imagens e melhorar a precisão da geração de imagens e da experiência do usuário, adicionando tags estéticas, qualidade de atualização e tags de ano. Além disso, o processo de treinamento do modelo e o tamanho do conjunto de dados foram significativamente melhorados, garantindo a alta qualidade e diversidade das imagens geradas.
O recém-lançado Animagine XL 3.1 é um modelo de texto para imagem com tema de animação de código aberto que foi atualizado e otimizado para melhorar a compreensão de uma ampla variedade de trabalhos e estilos de animação. A nova versão resolve o problema de superexposição, adiciona rótulos estéticos e atualiza os rótulos de qualidade e ano para gerar imagens mais alinhadas às necessidades do usuário. O método de classificação de rótulos é usado para melhorar a precisão dos resultados gerados. Durante o processo de treinamento, 2 GPUs A100 de 80 GB foram usadas por cerca de 350 horas de treinamento. O pré-treinamento usa um conjunto de dados contendo 870.000 imagens ordenadas e rotuladas, o que fornece uma base de conhecimento profunda para o modelo. Este modelo se concentra na geração de imagens no estilo anime, otimizando a anatomia das mãos, a qualidade dos detalhes da imagem e a análise imediata e a compreensão conceitual dos resultados de saída.As melhorias no Animagine XL 3.1 elevam-no a um nível superior na geração de imagens em estilo de animação, e o recurso de código aberto também facilita pesquisas e aplicações adicionais por desenvolvedores e entusiastas. Acredita-se que este modelo desempenhará um papel maior no campo da criação de animação no futuro e continuará a melhorar para trazer aos usuários uma melhor experiência de geração de imagens.