A equipe Colossal-AI abriu o código-fonte de seu modelo de geração de vídeo mais recente, Open-Sora, que atraiu ampla atenção. Este modelo usa a arquitetura Diffusion Transformer para melhorar significativamente a qualidade da geração de vídeo por meio de treinamento em vários estágios. Mais importante ainda, a equipe também fornece scripts de pré-processamento de dados convenientes e fáceis de usar, o que reduz o limite do usuário e permite a participação de mais desenvolvedores.
A equipe Colossal-AI lançou o Open-Sora de código aberto, que usa a arquitetura Diffusion Transformer para geração de vídeo e melhora a qualidade por meio de treinamento em vários estágios. A equipe de autores fornece scripts convenientes de pré-processamento de dados para reduzir o limite técnico. Open-Sora apresenta excelentes efeitos de geração de vídeo e chama a atenção.
O código aberto do Open-Sora traz novas possibilidades para o campo da geração de vídeo. Sua arquitetura eficiente e ferramentas convenientes certamente promoverão o desenvolvimento tecnológico e a inovação em aplicações neste campo. Esperamos que o Open-Sora possa desempenhar um papel em mais cenários no futuro.