Mehr als hundert Tage nachdem Vidu online ging, brachte Shengshu Technology die Vidu-Version 1.5 auf den Markt. Diese Version hat weltweit führende Durchbrüche beim Verständnis verschiedener Eingaben und der Lösung von „Konsistenz“-Problemen erzielt. Der Herausgeber von Downcodes wird Ihnen ein detailliertes Verständnis der Innovationen vermitteln, die Vidu 1.5 mit sich bringt, und wie es das visuelle Modell dazu bringt, in die „Kontext“-Ära vorzudringen und die Einführung allgemeiner künstlicher Intelligenz (AGI) zu beschleunigen.
Anlässlich der Tatsache, dass Vidu seit mehr als 100 Tagen online ist, ist Shengshu Technology stolz, die Veröffentlichung der neuen Version von Vidu 1.5 bekannt zu geben, die weltweit führende Durchbrüche erzielt hat, insbesondere beim Verständnis verschiedener Eingaben und beim Durchbrechen der „Konsistenz“. Problem.
Mit der Einführung von Vidu1.5 tritt das visuelle Modell in eine neue „Kontext“-Ära ein und beschleunigt die Einführung allgemeiner künstlicher Intelligenz (AGI). Vidu ist seit seiner weltweiten Einführung in der Lage, konsistente Charaktere zu generieren, und löst wichtige Probleme bei der Videogenerierung, indem es die Gesichtszüge der Charaktere sperrt. Im September veröffentlichte Vidu als weltweit erstes Unternehmen die Funktion „Subjektkonsistenz“, die die Gesichtskonsistenz auf die Ganzkörperkonsistenz erweitert und den Anwendungsbereich auf beliebige Motive wie Tiere, Objekte und virtuelle Charaktere erweitert. Die technologischen Durchbrüche von Vidu spiegeln sich hauptsächlich in drei Aspekten wider: präzise Steuerung komplexer Motive, natürliche Konsistenz der Gesichtszüge und dynamischen Ausdrücke von Charakteren sowie Konsistenz bei mehreren Motiven.


Vidu1.5 demonstriert die neue „intelligente Entstehung“ des visuellen Modells und seine leistungsstarken kontextbezogenen Lernfähigkeiten. Dies bedeutet, dass das visuelle Modell nicht nur die Fähigkeit zum Verstehen und Vorstellen besitzt, sondern auch die Speicherverwaltung während des Generierungsprozesses durchführen kann. Vidu1.5 setzt seine branchenführende Generierungseffizienz fort und kann ein Video in weniger als 30 Sekunden generieren. Vidu hält an dem Konzept der Vielseitigkeit und einer Designphilosophie fest, die mit LLM (Large Language Model) übereinstimmt, indem es alle Probleme in visuelle Eingabe- und visuelle Ausgabeprobleme vereinheitlicht und einen einzigen Transformator verwendet, um Ein- und Ausgaben mit variabler Länge einheitlich zu modellieren und Videodaten abzurufen Intelligenz in Kompression.
Die Einführung von Vidu1.5 verbessert nicht nur die Steuerbarkeit von Videomodellen, sondern ermöglicht auch die konsistente Erzeugung mehrerer Blickwinkel, mehrerer Motive und mehrerer Elemente durch flexible Mehrfacheingaben. Dies markiert die Entstehung der visuellen Intelligenz und beschleunigt die Einführung von AGI. Vidu ist nicht mehr nur ein hochwertiger, effizienter Videogenerator, sondern kann auch Kontextinformationen und Erinnerungen in den Generierungsprozess einbeziehen. Dies ist ein „großer Sprung“ in der visuellen modalen Intelligenz. Das visuelle Modell wird über stärkere kognitive Fähigkeiten verfügen und zu einem wichtigen Teil des AGI-Puzzles werden.
Erlebnisadresse: www.vidu.studio
Die Veröffentlichung von Vidu Version 1.5 läutet ein neues Kapitel in der visuellen KI-Technologie ein. Seine leistungsstarken Funktionen und die komfortable Bedienung werden den Benutzern auf jeden Fall ein neues Erlebnis der Videogeneration bescheren. Wir freuen uns darauf, dass Vidu weiterhin Durchbrüche in der zukünftigen Entwicklung erzielt und mehr zur Einführung von AGI beiträgt!