O modelo grande Tencent Hunyuan Wenshengtu (modelo Hunyuan DiT) é oficialmente de código aberto! Este código aberto inclui código de treinamento completo, bem como plug-ins LoRA e ControlNet para facilitar aos desenvolvedores o desenvolvimento e aplicação secundários. O plug-in LoRA permite o ajuste fino do modelo sem aumentar o tamanho do modelo, enquanto o plug-in ControlNet permite melhor controle do processo de geração de imagem adicionando condições adicionais, como bordas da imagem, profundidade e pose humana. A Tencent também fornece ao Hunyuan DiT uma biblioteca de aceleração dedicada para melhorar a eficiência do raciocínio e simplificar o processo de uso. Este modelo tem sido amplamente utilizado na criação de materiais, síntese de produtos, gráficos de jogos e outras áreas, e foi adotado pela plataforma Tencent Advertising Muse e por muitas mídias.
Notícias do ChinaZ.com em 21 de junho: Tencent Hunyuan Wensheng Tu Model (Hunyuan DiT Model) anunciou um código de treinamento de código aberto abrangente, incluindo plug-in LoRA e plug-in ControlNet.
LoRA é uma técnica para ajustar modelos de linguagem grande. Ela pode usar uma pequena quantidade de dados para treinar um modelo com características específicas sem modificar o modelo original ou aumentar o tamanho do modelo.

ControlNet é um algoritmo de geração controlável que permite aos usuários controlar melhor a geração de imagens adicionando condições adicionais. Tencent Hunyuan fornece três modelos ControlNet de primeiro lançamento que podem extrair e aplicar condições como bordas, profundidade e postura humana de imagens.
Além disso, Hunyuan DiT lançou uma biblioteca de aceleração dedicada para melhorar a eficiência do raciocínio e simplificar o uso. Hunyuan DiT tem sido amplamente utilizado em muitos campos, como criação de materiais, síntese de produtos, gráficos de jogos, etc., incluindo a plataforma Tencent Advertising Miaosi e muitas mídias usando o modelo Hunyuan DiT para geração de conteúdo.
Site oficial:
https://dit.hunyuan.tencent.com/
Código:
https://github.com/Tencent/HunyuanDiT
Modelo:
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
papel:
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
Processo de produção de dados:
https://github.com/Tencent/HunyuanDiT/blob/main/IndexKits/docs/MakeDataset.md
O código aberto do modelo Hunyuan DiT da Tencent fornece aos desenvolvedores ferramentas e recursos poderosos. Acredito que promoverá o desenvolvimento do campo gráfico vicentino, e também esperamos ver aplicações mais inovadoras baseadas neste modelo.