Model Video Teknologi Shengshu Model Vidu Versi 1.5 Rilis Mengatasi Masalah "Multi -Subjek Konsistensi" - Artikel AI

Penulis：Eve Cole Waktu Pembaruan：2025-02-12 03:32:01

Lebih dari seratus hari setelah Vidu diluncurkan, Shengshu Technology dengan megah meluncurkan Vidu Versi 1.5, yang telah membuat terobosan terkemuka di dunia dalam memahami input yang beragam dan memecahkan masalah "konsistensi". Ini menandai masuknya model visual ke dalam era "konteks" dan meletakkan dasar yang kuat untuk pengembangan kecerdasan buatan umum (AGI) yang dipercepat. Vidu 1.5 bukan peningkatan fungsional yang sederhana, tetapi refleksi dari kemunculan kecerdasan model visual.

Lebih dari 100 hari setelah Vidu diluncurkan, Shengshu Technology dengan bangga mengumumkan peluncuran versi baru Vidu1.5, yang mencapai terobosan di tingkat terkemuka dunia, terutama dalam memahami input yang beragam dan memecahkan masalah "konsistensi".

Peluncuran Vidu1.5 menandai masuknya model visual ke era baru "konteks" dan mempercepat kedatangan Kecerdasan Buatan Umum (AGI). Vidu memiliki kemampuan untuk menghasilkan karakter secara konsisten pada awal peluncuran globalnya, dan memecahkan titik -titik nyeri kunci dalam pembuatan video dengan mengunci fitur wajah karakter. Pada bulan September, Vidu adalah yang pertama di dunia yang merilis fungsi "konsistensi subjek", memperluas konsistensi wajah ke konsistensi seluruh tubuh dan memperluas ruang lingkup ke subjek apa pun seperti hewan, objek, dan karakter virtual. Terobosan teknologi Vidu terutama tercermin dalam tiga aspek: kontrol yang tepat dari subjek yang kompleks, konsistensi alami fitur wajah dan ekspresi dinamis, dan konsistensi multi-subjek.

微信截图_20241113135537.png

微信截图_20241113135531.png

Vidu1.5 menunjukkan "kemunculan kecerdasan" baru dari model visual, menunjukkan kemampuan belajar konteksnya yang kuat. Ini berarti bahwa model visual tidak hanya memiliki kemampuan untuk memahami dan membayangkan, tetapi juga dapat mengelola memori selama proses generasi. Vidu1.5 melanjutkan efisiensi generasi terkemuka di industri, menghasilkan video dalam waktu kurang dari 30 detik. Vidu menganut konsep universalitas, filosofi desain yang konsisten dengan LLM (model bahasa besar), menyatukan semua masalah menjadi masalah dengan input visual dan output visual, menggunakan transformator tunggal untuk memodelkan input dan output panjang variabel secara seragam, dan menggunakan satu Transformer untuk menyatukan pemodelan input dan output panjang variabel, dan dari data video mendapatkan kecerdasan dalam kompresi.

Peluncuran Vidu1.5 tidak hanya meningkatkan pengendalian model video, tetapi juga mencapai generasi yang konsisten dari berbagai sudut, beberapa subjek dan beberapa elemen melalui input yang fleksibel dan beragam. Ini menandai kemunculan kecerdasan visual dan mempercepat kedatangan AGI. Vidu tidak lagi hanya generator video berkualitas tinggi dan efisien, ia juga dapat menggabungkan informasi dan memori kontekstual dalam proses pembuatan. Model visual akan memiliki kemampuan kognitif yang lebih kuat dan menjadi teka -teki penting bagi AGI.

Alamat Pengalaman: www.vidu.studio

Pelepasan Vidu 1.5 tidak hanya terobosan teknologi, tetapi juga kemajuan tonggak di bidang kecerdasan visual. Ini memberikan kemungkinan baru untuk pengembangan AGI di masa depan, dan ada baiknya menantikan penerapan dan inovasi di lebih banyak bidang. Selamat datang untuk mengunjungi alamat pengalaman dan mengalami pesona kecerdasan visual!