Surveillance_Video_Summarizer Descargar - Surveillance_Video

Surveillance_Video_Summarizer

Otro código fuente

1.0.0

Descargar

? Vigilancia de videos resumidos: análisis y resumen de video con IA

Verificado el 13.09.2024 ✅ (este proyecto se desarrolla probado en la plataforma Lightning AI, que se ejecuta en una GPU L40)

Vigilance Video Summarizer es un sistema impulsado por la IA que procesa videos de vigilancia, extrae marcos clave y genera anotaciones detalladas. Impulsado por un modelo de lenguaje de visión Florence-2 (VLM) de Florence-2 (VLM) capacitado específicamente en el conjunto de datos de Sphar, destaca eventos, acciones y objetos notables dentro de las imágenes de video y los registra para una fácil revisión y un análisis posterior.

El modelo ajustado se puede encontrar en: Kndrvitja/Florence-Sphar-Finetune-2.

¡Vea la herramienta en acción a continuación!

? Video de demostración

Características

Resumen de video con IA
Extraiga automáticamente los marcos de los videos de vigilancia y genere anotaciones que capturan acciones, interacciones, objetos y eventos inusuales. Las anotaciones se almacenan en una base de datos SQLite para una fácil recuperación.
Procesamiento de cuadros en tiempo real
Al utilizar el roscado asincrónico, el sistema procesa los marcos de video de manera eficiente, lo que permite el análisis en tiempo real al tiempo que minimiza los cuellos de botella de rendimiento. Registra cada segundo, asegurando una fácil depuración y verificación.
Florence-2 VLM sintonizado para el conjunto de datos de Sphar
El proceso de resumen está impulsado por un VLM Florence-2 ajustado, específicamente entrenado en el conjunto de datos de Sphar. Este modelo está optimizado para detectar y describir eventos específicos de vigilancia con mayor precisión.
Interfaz interactiva con motor de gradio
Interactuar con los registros de vigilancia a través de una interfaz web basada en Gradio. Puede especificar rangos de tiempo, y el sistema recuperará, resumirá y analizará los registros anotados, proporcionando información detallada sobre las imágenes de video durante el período seleccionado utilizando la API de OpenAI. Esta funcionalidad se puede extender para aprovechar modelos avanzados como Gemini, lo que permite un manejo más eficiente de videos de contexto más largos y entregando un resumen de video más completo sobre los plazos extendidos.

Cómo funciona

Extracción de marco :
Los marcos se extraen a intervalos regulares de los archivos de video de vigilancia utilizando OpenCV.
Anotación con AI :
Cada cuadro es analizado por el modelo de lenguaje de visión Florence-2 ajustado, generando anotaciones perspicaces sobre la escena.
Almacenamiento de datos :
Las anotaciones y sus datos de cuadro asociados se almacenan en una base de datos SQLite, listas para un análisis futuro.
Interfaz Gradio : el sistema permite a los usuarios consultar sin esfuerzo registros de vigilancia al proporcionar un rango de tiempo específico y indicaciones personalizadas. Recupera, resume y analiza las imágenes de video relevantes, que ofrece ideas concisas

Instalación

Clon el repositorio :

git clone https://github.com/Ravi-Teja-konda/Surveillance_Video_Summarizer.git

Navegue al directorio del proyecto :

 cd Surveillance_Video_Summarizer

Instale las bibliotecas de Python requeridas :

pip install -r requirements.txt

Configuración

Modelo y procesador

El sistema utiliza el modelo de lenguaje de visión Florence-2 ajustado para el conjunto de datos de Sphar. El modelo ajustado se puede encontrar en Kndrvitja/Florence-Sphar-Finetune-2.
Asegúrese de tener su clave API OpenAI almacenada en un archivo .env según sea necesario.

Ruta de la base de datos

La base de datos SQLite predeterminada para almacenar datos de cuadro se encuentra en /teamspace/studios/florence_2_video_analytics/florence_2_video_analytics.db. Puede modificar esta ruta.

Uso

En primer lugar, ejecute la extracción de cuadro:

python surveillance_video_summarizer.py

A continuación, interactúe con la interfaz de Gradio para el análisis de registro:

python surveillance_log_analyzer_with_gradio.py

Desde aquí, puede usar la interfaz de Gradio para consultar períodos específicos de video y recuperar resúmenes anotados en función de su entrada. Puede consultar el sistema para acciones específicas, eventos notables o resúmenes de actividad general. Proporcionar el rango de tiempo y su solicitud de consulta, y el sistema devolverá los registros relevantes

Mejoras futuras

Detección de eventos avanzados

Planeamos mejorar la capacidad del modelo para detectar eventos más complejos, como violaciones de tráfico, comportamiento sospechoso y otros escenarios de vigilancia matizados mediante la capacitación de Florence-2 con más datos.

Transmisión en tiempo real

En el futuro, planeará apoyar transmisiones de video en tiempo real para la extracción y análisis de cuadros inmediatos a medida que se captura el video.