Site Web officiel www.binance.com/ZH-CN :Entrez le site officiel ☜☜
Application: ☞☞Official App Download☜☜
Récemment, HPC-AI Tech a annoncé le lancement d'Open-Sora 2.0, un système d'IA vidéo révolutionnaire qui peut atteindre une qualité de qualité commerciale à environ un dixième du coût de formation typique. Ce progrès marque un éventuel changement de paradigme dans le champ Video IA à forte intensité de ressources, comparable aux gains d'efficacité observés dans les modèles de langues.
Bien que les systèmes de génération de vidéos de haute qualité existants comme Gen Gen et Step-Video-T2V puissent nécessiter des millions de dollars en formation, les dépenses de formation de l'Open-SORA2.0 ne représentent que 200 000 $. Malgré la réduction substantielle des coûts, les tests ont montré que sa qualité de sortie est comparable aux systèmes commerciaux établis tels que la piste Gen-3alpha et Hunyuanvideo. Le système utilise 224 NVIDIA H200GPUS pour la formation.
Astuce: "Deux femmes sont assises sur un canapé beige, la pièce est chaleureuse et confortable, avec des murs de briques en arrière-plan. Ils parlent joyeusement, sourient et élèvent des verres pour célébrer le vin rouge dans le tir intime de la scène moyenne." | Vidéo: HPC-AI Tech
Open-SORA2.0 réalise son efficacité grâce à un nouveau processus de formation en trois étapes, en commençant par une vidéo à basse résolution et affine progressivement des résolutions plus élevées. Les modèles d'images pré-formés intégrés tels que le flux optimisent davantage l'utilisation des ressources. À son cœur, l'autoencoder vidéo DC-AE, qui fournit d'excellents taux de compression par rapport aux méthodes traditionnelles. Cette innovation se traduit par une vitesse de formation de 5,2x remarquable et plus rapide et plus de vitesse de génération de vidéos plus rapide. Bien que les taux de compression plus élevés entraînent une légère réduction des détails de sortie, il accélère considérablement le processus de création vidéo.
Astuce: "Une tomate surfait une tranche de laitue, en bas de la cascade de sauce au pâturage, des effets de surf exagérés et des vagues lisses mettent en évidence le plaisir de l'animation 3D." | Vidéo: HPC-AI Tech
Ce système open source peut générer des vidéos à partir de descriptions de texte et d'images uniques, et permet aux utilisateurs de contrôler l'intensité du mouvement dans les clips générés via la fonction de notation de mouvement. Les exemples fournis par HPC-AI Tech présentent une variété de scénarios, notamment un dialogue réaliste et des animations fantaisistes.
Cependant, Open-SORA 2.0 a actuellement des limites de résolution (768x768 pixels) et une durée vidéo maximale (5 secondes ou 128 images), qui est inférieure aux capacités de modèles de premier plan tels que Sora d'Openai. Néanmoins, ses performances dans des domaines clés tels que la qualité visuelle, la précision des indices et le traitement du mouvement abordent les normes commerciales. Il convient de noter que le score VBENCH de l'Open-SORA2.0 n'est désormais que de 0,69% de Sora d'Openai, une amélioration significative par rapport aux 4,52% de la version précédente.
Astuce: "Un tas de champignons anthropomorphes organisent une fête disco dans une forêt magique sombre, accompagnée de néons clignotants et de marches de danse exagérées, leurs textures lisses et leurs surfaces réfléchissantes mettent l'accent sur la drôle d'apparence 3D." | Vidéo: HPC-AI Tech
La stratégie rentable de l'Open-SORA2.0 fait écho au «moment Deepseek» dans le modèle de langue, lorsque l'amélioration des méthodes de formation a permis aux systèmes open source d'obtenir des performances de niveau commercial à un coût beaucoup plus faible que les systèmes commerciaux. Cette évolution pourrait exercer une pression à la baisse sur les prix dans le champ Video IA, qui est actuellement facturé par quelques secondes en raison d'une demande informatique élevée.

Comparaison des coûts de formation: Open-SORA2.0 coûte environ 200 000 $, tandis que la génération de films coûte 2,5 millions de dollars, et Step-Video-T2V coûte 1 million de dollars. | Photo: HPC-AI Tech
Malgré ces progrès, l'écart de performance entre l'open source et l'IA vidéo commerciale est toujours supérieur à celui des modèles de langue, mettant en évidence les défis techniques en cours dans le domaine. Open-SORA2.0 est désormais disponible en tant que projet open source sur GitHub.