Das Hunyuan Wenshengtu-Großmodell (Hunyuan DiT-Modell) von Tencent ist offiziell Open Source! Diese Open Source umfasst vollständigen Trainingscode sowie LoRA- und ControlNet-Plug-ins, was Entwicklern die sekundäre Entwicklung und Anwendung erleichtert. Das LoRA-Plug-in ermöglicht eine Feinabstimmung des Modells, ohne die Modellgröße zu erhöhen, während das ControlNet-Plug-in eine bessere Kontrolle des Bilderzeugungsprozesses durch Hinzufügen zusätzlicher Bedingungen wie Bildkanten, Tiefe und menschliche Pose ermöglicht. Tencent stellt Hunyuan DiT außerdem eine spezielle Beschleunigungsbibliothek zur Verfügung, um die Argumentationseffizienz zu verbessern und den Nutzungsprozess zu vereinfachen. Dieses Modell wird häufig in der Materialerstellung, Produktsynthese, Spielgrafik und anderen Bereichen verwendet und von der Tencent Advertising Muse-Plattform und vielen Medien übernommen.
Neuigkeiten von ChinaZ.com vom 21. Juni: Tencent Hunyuan Wensheng Tu Model (Hunyuan DiT Model) kündigte einen umfassenden Open-Source-Trainingscode an, einschließlich LoRA-Plug-In und ControlNet-Plug-In.
LoRA ist eine Technik zur Feinabstimmung großer Sprachmodelle. Sie kann eine kleine Datenmenge verwenden, um ein Modell mit bestimmten Merkmalen zu trainieren, ohne das ursprüngliche Modell zu ändern oder die Modellgröße zu erhöhen.

ControlNet ist ein steuerbarer Generierungsalgorithmus, der es Benutzern ermöglicht, die Bildgenerierung durch Hinzufügen zusätzlicher Bedingungen besser zu steuern. Tencent Hunyuan bietet drei ControlNet-Modelle der ersten Generation, die Bedingungen wie Kanten, Tiefe und menschliche Körperhaltung von Bildern extrahieren und anwenden können.
Darüber hinaus hat Hunyuan DiT eine spezielle Beschleunigungsbibliothek veröffentlicht, um die Argumentationseffizienz zu verbessern und die Verwendung zu vereinfachen. Hunyuan DiT wird in vielen Bereichen wie Materialerstellung, Produktsynthese, Spielgrafiken usw. häufig eingesetzt, einschließlich der Tencent Advertising Miaosi-Plattform und vielen Medien, die das Hunyuan DiT-Modell zur Inhaltsgenerierung verwenden.
Offizielle Website:
https://dit.hunyuan.tencent.com/
Code:
https://github.com/Tencent/HunyuanDiT
Modell:
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
Papier:
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
Datenproduktionsprozess:
https://github.com/Tencent/HunyuanDiT/blob/main/IndexKits/docs/MakeDataset.md
Die offene Quelle des Hunyuan-DiT-Modells von Tencent stellt Entwicklern leistungsstarke Tools und Ressourcen zur Verfügung. Ich glaube, dass dies die weitere Entwicklung des Vincentian-Graph-Bereichs vorantreiben wird, und wir freuen uns auch auf weitere innovative Anwendungen, die auf diesem Modell basieren.