Tencent의 Hunyuan Wenshengtu 대형 모델(Hunyuan DiT 모델)이 공식적으로 오픈 소스입니다! 이 오픈 소스에는 완전한 교육 코드는 물론 LoRA 및 ControlNet 플러그인이 포함되어 있어 개발자가 보조 개발 및 애플리케이션을 쉽게 사용할 수 있습니다. LoRA 플러그인을 사용하면 모델 크기를 늘리지 않고도 모델을 미세 조정할 수 있으며, ControlNet 플러그인을 사용하면 이미지 가장자리, 깊이, 사람 자세와 같은 추가 조건을 추가하여 이미지 생성 프로세스를 더 효과적으로 제어할 수 있습니다. Tencent는 또한 Hunyuan DiT에 전용 가속 라이브러리를 제공하여 추론 효율성을 높이고 사용 프로세스를 단순화합니다. 이 모델은 소재 제작, 제품 합성, 게임 그래픽 및 기타 분야에서 널리 사용되었으며 Tencent Advertising Muse 플랫폼과 많은 미디어에서 채택되었습니다.
6월 21일 ChinaZ.com의 뉴스: Tencent Hunyuan Wensheng Tu 모델(Hunyuan DiT 모델)은 LoRA 플러그인 및 ControlNet 플러그인을 포함한 포괄적인 오픈 소스 교육 코드를 발표했습니다.
LoRA는 대규모 언어 모델을 미세 조정하는 기술로, 원본 모델을 수정하거나 모델 크기를 늘리지 않고도 소량의 데이터를 사용하여 특정 특성을 가진 모델을 학습할 수 있습니다.

ControlNet은 사용자가 추가 조건을 추가하여 이미지 생성을 더 효과적으로 제어할 수 있는 제어 가능한 생성 알고리즘입니다. Tencent Hunyuan은 이미지의 가장자리, 깊이, 인간 자세와 같은 조건을 추출하고 적용할 수 있는 세 가지 1세대 ControlNet 모델을 제공합니다.
또한 Hunyuan DiT는 추론 효율성을 향상하고 사용을 단순화하기 위해 전용 가속 라이브러리를 출시했습니다. Hunyuan DiT는 콘텐츠 생성을 위해 Hunyuan DiT 모델을 사용하는 Tencent Advertising Miaosi 플랫폼과 많은 미디어를 포함하여 자료 제작, 제품 합성, 게임 그래픽 등과 같은 많은 분야에서 널리 사용되었습니다.
공식 웹사이트:
https://dit.hunyuan.tencent.com/
암호:
https://github.com/Tencent/HunyuanDiT
모델:
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
종이:
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
데이터 생산 과정:
https://github.com/Tencent/HunyuanDiT/blob/main/IndexKits/docs/MakeDataset.md
Tencent Hunyuan DiT 모델의 오픈 소스는 개발자에게 강력한 도구와 리소스를 제공하여 Vincentian 그래프 분야의 발전을 촉진할 것이며 우리는 또한 이 모델을 기반으로 하는 더 혁신적인 애플리케이션을 볼 수 있기를 기대합니다.