Большая модель Hunyuan Wenshengtu от Tencent (модель Hunyuan DiT) официально открыта! Этот открытый исходный код включает в себя полный обучающий код, а также плагины LoRA и ControlNet, которые облегчают разработчикам вторичную разработку и применение. Плагин LoRA позволяет выполнить точную настройку модели без увеличения размера модели, а плагин ControlNet позволяет лучше контролировать процесс создания изображения за счет добавления дополнительных условий, таких как края изображения, глубина и поза человека. Tencent также предоставляет Hunyuan DiT специальную библиотеку ускорения, позволяющую повысить эффективность рассуждений и упростить процесс использования. Эта модель широко использовалась в создании материалов, синтезе продуктов, игровой графике и других областях, а также была принята на платформе Tencent Advertising Muse и во многих средствах массовой информации.
Новости с сайта ChinaZ.com от 21 июня: Tencent Hunyuan Wensheng Tu Model (Hunyuan DiT Model) анонсировала комплексный учебный код с открытым исходным кодом, включая плагин LoRA и плагин ControlNet.
LoRA — это метод точной настройки больших языковых моделей. Он может использовать небольшой объем данных для обучения модели с определенными характеристиками без изменения исходной модели или увеличения ее размера.

ControlNet — это управляемый алгоритм генерации, который позволяет пользователям лучше контролировать генерацию изображений путем добавления дополнительных условий. Tencent Hunyuan предлагает три модели ControlNet первого поколения, которые могут извлекать и применять такие условия, как края, глубина и положение человека на изображениях.
Кроме того, Hunyuan DiT выпустила специальную библиотеку ускорения, позволяющую повысить эффективность рассуждений и упростить использование. Hunyuan DiT широко используется во многих областях, таких как создание материалов, синтез продуктов, игровая графика и т. д., включая рекламную платформу Tencent Miaosi и многие средства массовой информации, использующие модель Hunyuan DiT для создания контента.
Официальный сайт:
https://dit.hunyuan.tencent.com/
Код:
https://github.com/Tencent/HunyuanDiT
Модель:
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
бумага:
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
Процесс производства данных:
https://github.com/Tencent/HunyuanDiT/blob/main/IndexKits/docs/MakeDataset.md
Модель Hunyuan DiT с открытым исходным кодом предоставляет разработчикам мощные инструменты и ресурсы. Я считаю, что это будет способствовать дальнейшему развитию области графов Винсента, и мы также с нетерпением ждем появления новых инновационных приложений, основанных на этой модели.