Nvidia ได้เปิดตัวการค้นหาวิดีโอ AI ใหม่และพิมพ์เขียวสรุป การวิเคราะห์วิดีโอ โซลูชันนี้ขึ้นอยู่กับสถาปัตยกรรม Nvidia Nim Microservice อินเทอร์เฟซ REST Simple API ส่วนประกอบหลักของมัน ได้แก่ โปรเซสเซอร์สตรีม, NEMO Guardrails, ท่อ VLM ที่ใช้ NVIDIA Deepstream SDK, ฐานข้อมูลเวกเตอร์, โมดูล RAG ที่รับรู้บริบทและโมดูลกราฟ-แร็กร่วมกันใช้กระบวนการวิเคราะห์วิดีโอที่มีประสิทธิภาพ
Nvidia เพิ่งเปิดตัวการค้นหาวิดีโอ AI ใหม่และพิมพ์เขียวสรุป (พิมพ์เขียว AI สำหรับการค้นหาวิดีโอและการสรุป) โซลูชันทางเทคนิคที่จะเปลี่ยนข้อ จำกัด ของการวิเคราะห์วิดีโอแบบดั้งเดิมอย่างสมบูรณ์ ซึ่งแตกต่างจากโมเดลคงที่ที่ได้รับการยอมรับเฉพาะวัตถุที่ตั้งไว้ล่วงหน้าในอดีตโซลูชันใหม่ได้รับความเข้าใจอย่างลึกซึ้งและการมีปฏิสัมพันธ์กับเนื้อหาวิดีโอตามธรรมชาติโดยการรวม AI Generative, Model Visual Language Model (VLM) และ Model Language Language (LLM)
ระบบนี้สร้างขึ้นบนสถาปัตยกรรม Nvidia Nim Microservice และความได้เปรียบหลักของมันอยู่ในความสามารถในการทำความเข้าใจวิดีโอที่ทรงพลัง ด้วยการรวมเทคโนโลยีแบบออร์แกนิกเช่นการประมวลผลการแบ่งส่วนวิดีโอการสร้างคำอธิบายอย่างเข้มข้นและการสร้างกราฟความรู้ระบบสามารถเข้าใจและวิเคราะห์เนื้อหาวิดีโอที่ยาวนานเป็นพิเศษได้อย่างแม่นยำ ผู้ใช้สามารถใช้อินเทอร์เฟซ REST API อย่างง่ายเพื่อรับรู้การสร้างวิดีโอสรุปคำถามและคำตอบแบบโต้ตอบและการตรวจสอบเหตุการณ์ที่กำหนดเองของสตรีมวิดีโอแบบเรียลไทม์

จากสถาปัตยกรรมทางเทคนิคโซลูชันนี้มีส่วนประกอบสำคัญหลายอย่าง: โปรเซสเซอร์สตรีมรับผิดชอบการโต้ตอบและการซิงโครไนซ์ระหว่างส่วนประกอบ; เวกเตอร์ฐานข้อมูลจัดเก็บผลลัพธ์ระดับกลาง

ในแอปพลิเคชันที่ใช้งานได้จริงระบบจะแบ่งวิดีโอออกเป็นส่วนเล็ก ๆ ก่อนสร้างคำอธิบายอย่างเข้มข้นผ่าน VLM จากนั้นใช้ LLM เพื่อสรุปและวิเคราะห์ผลลัพธ์ สำหรับสตรีมสดระบบสามารถประมวลผลคลิปวิดีโออย่างต่อเนื่องและสร้างบทสรุปในเวลาจริง ในเวลาเดียวกันโดยการสร้างกราฟความรู้ระบบสามารถจับข้อมูลที่ซับซ้อนในวิดีโอได้อย่างถูกต้องและสนับสนุนการโต้ตอบคำถามและคำตอบที่ลึกซึ้งยิ่งขึ้น
ความก้าวหน้าทางเทคโนโลยีนี้จะนำการเปลี่ยนแปลงการปฏิวัติไปสู่โรงงานคลังสินค้าร้านค้าปลีกสนามบินและศูนย์กลางการขนส่ง ทีมปฏิบัติการสามารถได้รับข้อมูลเชิงลึกเกี่ยวกับวิดีโอที่สมบูรณ์ยิ่งขึ้นผ่านการโต้ตอบภาษาธรรมชาติเพื่อทำการตัดสินใจอย่างชาญฉลาด
ในปัจจุบัน NVIDIA ได้เปิดแอปพลิเคชันการเข้าถึงก่อนกำหนดสำหรับโปรแกรมทางเทคนิคนี้ นักพัฒนาสามารถเลือกแบบจำลองที่เหมาะสมผ่านไดเรกทอรี API ที่จัดทำโดย NVIDIA ไม่ว่าจะใช้บริการ NVIDIA โฮสต์หรือเลือกโซลูชันการปรับใช้ในท้องถิ่น ตัวเลือกการปรับใช้ที่ยืดหยุ่นนี้จะช่วยให้องค์กรสร้างโซลูชันการวิเคราะห์วิดีโอที่กำหนดเองตามความต้องการที่แท้จริง
ด้วยความก้าวหน้าอย่างต่อเนื่องของเทคโนโลยี AI เรากำลังเห็นการเปลี่ยนแปลงการสั่นสะเทือนของโลกในด้านการวิเคราะห์วิดีโอ การเปิดตัว NVIDIA ซึ่งเป็นโซลูชันทางเทคนิคล่าสุดจะเร่งการใช้งานการวิเคราะห์วิดีโออัจฉริยะในอุตสาหกรรมต่าง ๆ อย่างไม่ต้องสงสัย
รายละเอียด: https://developer.nvidia.com/blog/build-a-video-search-and-summarization-agent-with-nvidia-ai-lueprint
ในระยะสั้นการค้นหาวิดีโอ AI ของ Nvidia และพิมพ์เขียวสรุปการวิเคราะห์วิดีโอที่มีประสิทธิภาพและยืดหยุ่นนำความสามารถในการประมวลผลข้อมูลวิดีโอที่ชาญฉลาดและมีประสิทธิภาพมากขึ้นให้กับทุกอุตสาหกรรม การเข้าถึงโซลูชันนี้ยังช่วยให้นักพัฒนามีความเป็นไปได้มากขึ้นและหวังว่าจะได้เห็นแอพพลิเคชั่นที่เป็นนวัตกรรมมากขึ้นตามเทคโนโลยีนี้ในอนาคต