Biaya hanya sepersepuluh! Open-Sora 2.0 Video Open Source AI mencapai artikel komersial-AI

Penulis：Eve Cole Waktu Pembaruan：2025-05-20 13:25:02

2025 Binance Direct

Baru-baru ini, HPC-AI Tech mengumumkan peluncuran Open-Sora 2.0, sebuah sistem AI video terobosan yang dapat mencapai kualitas tingkat komersial hanya sekitar sepersepuluh dari biaya pelatihan yang khas. Kemajuan ini menandai kemungkinan perubahan paradigma dalam bidang AI video yang intensif sumber daya, sebanding dengan keuntungan efisiensi yang terlihat dalam model bahasa.

Sementara sistem pembuatan video berkualitas tinggi yang ada seperti Gen Film dan Step-Video-T2V mungkin memerlukan jutaan dolar dalam pelatihan, pengeluaran pelatihan Sora2.0 terbuka hanya sekitar $ 200.000. Terlepas dari pengurangan biaya yang substansial, pengujian telah menunjukkan bahwa kualitas outputnya sebanding dengan sistem komersial yang sudah mapan seperti landasan pacu Gen-3alpha dan hUNyuanvideo. Sistem ini menggunakan 224 NVIDIA H200GPUS untuk pelatihan.

Kiat: "Dua wanita duduk di sofa krem, ruangan itu hangat dan nyaman, dengan dinding bata di latar belakang. Mereka berbicara dengan gembira, tersenyum, dan mengangkat gelas untuk merayakan anggur merah dalam tembakan adegan tengah yang intim." | Video: Teknologi HPC-AI

Open-Sora2.0 mencapai efisiensinya melalui proses pelatihan tiga tahap baru, dimulai dengan video resolusi rendah dan secara bertahap memurnikan resolusi yang lebih tinggi. Model gambar pra-terlatih terintegrasi seperti fluks lebih lanjut mengoptimalkan pemanfaatan sumber daya. Pada intinya adalah video Autoencoder DC-AE, yang memberikan tingkat kompresi yang sangat baik dibandingkan dengan metode tradisional. Inovasi ini diterjemahkan menjadi kecepatan pelatihan 5.2x lebih cepat yang luar biasa dan lebih dari sepuluh kecepatan pembuatan video yang lebih cepat. Sementara laju kompresi yang lebih tinggi menyebabkan sedikit pengurangan detail output, ini sangat mempercepat proses pembuatan video.

Tip: "Tomat berselancar sepotong selada, menyusuri air terjun saus padang rumput, selancar yang berlebihan dan efek gelombang halus menyoroti kesenangan animasi 3D." | Video: Teknologi HPC-AI

Sistem open source ini dapat menghasilkan video dari deskripsi teks dan gambar tunggal, dan memungkinkan pengguna untuk mengontrol intensitas gerak dalam klip yang dihasilkan melalui fungsi penilaian gerak. Contoh yang disediakan oleh HPC-AI Tech menampilkan berbagai skenario, termasuk dialog yang realistis dan animasi aneh.

Namun, Open-Sora 2.0 saat ini memiliki keterbatasan dalam resolusi (768x768 piksel) dan durasi video maksimum (5 detik atau 128 frame), yang lebih rendah dari kemampuan model terkemuka seperti Sora Openai. Namun demikian, kinerjanya di bidang -bidang utama seperti kualitas visual, akurasi isyarat dan pemrosesan gerak mendekati standar komersial. Perlu dicatat bahwa skor VBench Open-Sora2.0 sekarang hanya 0,69% di belakang Openai's Sora, peningkatan yang signifikan dari versi sebelumnya 4,52%.

Kiat: "Sekelompok jamur antropomorfik mengadakan pesta disko di hutan ajaib yang gelap, disertai dengan lampu neon yang berkedip dan tangga tarian yang berlebihan, teksturnya yang halus dan permukaan reflektif menekankan penampilan 3D yang lucu." | Video: Teknologi HPC-AI

Strategi hemat biaya dari open-sora2.0 menggemakan "momen deepseek" dalam model bahasa, ketika metode pelatihan yang ditingkatkan memungkinkan sistem sumber terbuka untuk mencapai kinerja tingkat komersial dengan biaya yang jauh lebih rendah daripada sistem komersial. Pengembangan ini dapat memberi tekanan pada harga pada bidang video AI, yang saat ini dibebankan oleh detik karena permintaan komputasi yang tinggi.

Perbandingan biaya pelatihan: biaya open-sora2.0 sekitar $ 200.000, sementara gen film berharga $ 2,5 juta, dan step-video-T2V berharga $ 1 juta. | Foto: Teknologi HPC-AI

Terlepas dari kemajuan ini, kesenjangan kinerja antara open source dan video komersial AI masih lebih besar dari model bahasa, menyoroti tantangan teknis yang sedang berlangsung di lapangan. Open-Sora2.0 sekarang tersedia sebagai proyek open source di GitHub.