Model pembuatan video Vidu versi 1.5 dari Shengshu Technology dirilis untuk mengatasi masalah “konsistensi multi-subjek”

Penulis：Eve Cole Waktu Pembaruan：2025-03-06 16:00:04

Lebih dari seratus hari setelah Vidu online, Teknologi Shengshu dengan megahnya meluncurkan Vidu versi 1.5. Versi ini telah membuat terobosan terdepan di dunia dalam memahami beragam masukan dan memecahkan masalah "konsistensi". Editor Downcodes akan memberi Anda pemahaman mendalam tentang inovasi yang dibawa oleh Vidu 1.5 dan bagaimana ia mempromosikan model visual untuk beralih ke era "konteks" dan mempercepat hadirnya kecerdasan buatan umum (AGI).

Pada kesempatan Vidu telah online selama lebih dari 100 hari, Shengshu Technology dengan bangga mengumumkan peluncuran versi baru Vidu 1.5, yang telah mencapai terobosan terdepan di dunia, terutama dalam memahami beragam masukan dan menerobos "konsistensi". masalah.

Peluncuran Vidu1.5 menandai model visual memasuki era "konteks" baru, mempercepat hadirnya kecerdasan buatan umum (AGI). Vidu memiliki kemampuan untuk menghasilkan karakter yang konsisten sejak diluncurkan secara global, dan memecahkan masalah utama dalam pembuatan video dengan mengunci fitur wajah karakter. Pada bulan September, Vidu menjadi perusahaan pertama di dunia yang merilis fungsi "Konsistensi Subjek", memperluas konsistensi wajah hingga konsistensi seluruh tubuh, dan memperluas cakupan ke subjek apa pun seperti hewan, objek, dan karakter virtual. Terobosan teknologi Vidu terutama tercermin dalam tiga aspek: kontrol yang tepat terhadap subjek yang kompleks, konsistensi alami fitur wajah dan ekspresi karakter yang dinamis, dan konsistensi multi-subjek.

Vidu1.5 mendemonstrasikan "kemunculan cerdas" baru dari model visual dan kemampuan pembelajaran kontekstualnya yang kuat. Artinya model visual tidak hanya memiliki kemampuan memahami dan berimajinasi, tetapi juga dapat melakukan manajemen memori selama proses pembangkitannya. Vidu1.5 melanjutkan efisiensi generasi terdepan di industri dan dapat menghasilkan video dalam waktu kurang dari 30 detik. Vidu menganut konsep keserbagunaan dan filosofi desain yang konsisten dengan LLM (Model Bahasa Besar), menyatukan semua masalah menjadi masalah masukan visual dan keluaran visual, menggunakan Transformer tunggal untuk memodelkan masukan dan keluaran panjang variabel secara seragam, dan dari data video Dapatkan kecerdasan dalam kompresi.

Peluncuran Vidu1.5 tidak hanya meningkatkan kemampuan pengendalian model video, namun juga menghasilkan generasi berbagai sudut, subjek, dan elemen ganda yang konsisten melalui berbagai input yang fleksibel. Hal ini menandai munculnya kecerdasan visual dan mempercepat hadirnya AGI. Vidu bukan lagi sekedar generator video berkualitas tinggi dan efisien. Vidu juga dapat memasukkan informasi kontekstual dan memori ke dalam proses pembuatannya. Model visual akan memiliki kemampuan kognitif yang lebih kuat dan menjadi bagian penting dari teka-teki AGI.

Alamat pengalaman: www.vidu.studio

Peluncuran Vidu versi 1.5 menandai babak baru dalam teknologi AI visual. Fungsinya yang kuat dan pengoperasian yang mudah pasti akan menghadirkan pengalaman pembuatan video baru bagi pengguna. Kami berharap Vidu terus membuat terobosan dalam pengembangan masa depan dan berkontribusi lebih banyak terhadap kedatangan AGI!