Tencent の Hunyuan Wenshengtu ラージ モデル (Hunyuan DiT モデル) が正式にオープンソースになりました。このオープン ソースには、完全なトレーニング コードのほか、開発者による二次開発やアプリケーションを容易にする LoRA および ControlNet プラグインが含まれています。 LoRA プラグインを使用すると、モデル サイズを増やすことなくモデルを微調整できます。また、ControlNet プラグインを使用すると、画像のエッジ、深度、人間のポーズなどの追加条件を追加することで、画像生成プロセスをより適切に制御できます。 Tencent はまた、Hunyuan DiT に専用の高速化ライブラリを提供し、推論効率を向上させ、使用プロセスを簡素化します。このモデルはマテリアル作成、製品合成、ゲームグラフィックスなどの分野で広く使用されており、Tencent Advertising Muse プラットフォームや多くのメディアで採用されています。
6 月 21 日の ChinaZ.com からのニュース: Tencent Hunyuan Wensheng Tu Model (Hunyuan DiT Model) は、LoRA プラグインと ControlNet プラグインを含む包括的なオープンソース トレーニング コードを発表しました。
LoRA は、大規模な言語モデルを微調整するための手法であり、元のモデルを変更したりモデルのサイズを大きくしたりすることなく、少量のデータを使用して特定の特性を持つモデルをトレーニングできます。

ControlNet は、追加の条件を追加することで画像生成をより適切に制御できる制御可能な生成アルゴリズムです。 Tencent Hunyuan は、画像のエッジ、奥行き、人間の姿勢などの条件を抽出して適用できる 3 つの第一世代 ControlNet モデルを提供します。
さらに、Hunyuan DiT は、推論効率を向上させ、使用を簡素化するための専用のアクセラレーション ライブラリをリリースしました。 Hunyuan DiT は、Tencent Advertising Miaosi Platform やコンテンツ生成に Hunyuan DiT モデルを使用する多くのメディアを含め、素材作成、製品合成、ゲームグラフィックスなどの多くの分野で広く使用されています。
公式ウェブサイト:
https://dit.hunyuan.tencent.com/
コード:
https://github.com/Tencent/HunyuanDiT
モデル:
https://huggingface.co/Tencent-Hunyuan/HunyuanDiT
紙:
https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf
データ作成プロセス:
https://github.com/Tencent/HunyuanDiT/blob/main/IndexKits/docs/MakeDataset.md
Tencent の Hunyuan DiT モデルのオープンソースは、開発者に強力なツールとリソースを提供し、Vincentian グラフ分野のさらなる発展を促進すると信じています。また、このモデルに基づくより革新的なアプリケーションを期待しています。