Descargar mmaction2 - Descargar el código fuente mmaction2

mmaction2

Pitón

MMAction2 V1.2.0 Release

Descargar

Inglés | 简体中文

? Tabla de contenido

? Tabla de contenido
? Qué hay de nuevo
Introducción
? Características principales
Instalación
? Zoológico modelo
? ‍? Empezar
? Licencia
Citación
? Que contribuye
? Reconocimiento
Proyectos en OpenMMLab

? ¿Qué hay de nuevo?

La rama predeterminada se ha cambiado a main (anterior 1.x ) del master (actual 0.x ), y alentamos a los usuarios a migrar a la última versión con modelos más compatibles, puntos de control de pre-entrenamiento más fuertes y una codificación más simple. Consulte la Guía de migración para obtener más detalles.

Release (2023.10.12) : v1.2.0 con las siguientes características nuevas:

Algoritmo Multi-Modal de Soporte Vindlu y la capacitación de ActionClip
Admite modelo liviano MobileOne TSN/TSM
Soporte del conjunto de datos de recuperación de video MSVD
Admite la función K700 de Slowonly para entrenar modelos de localización
Apoyo a las demostraciones de video y audio

Introducción ?

MMACTION2 es una caja de herramientas de código abierto para la comprensión de video basada en Pytorch. Es parte del proyecto OpenMMLab.

Reconocimiento de acción en Kinetics-400 (izquierda) y reconocimiento de acción basado en esqueletos en NTU-RGB+D-120 (derecha)

Resultados de detección de acción y reconocimiento de acción espacio-temporal basado en esqueletos en Kinetics-400

Resultados de detección de acción espacio-temporal en AVA-2.1

? Características principales?

Diseño modular : descomponemos un marco de comprensión de video en diferentes componentes. Uno puede construir fácilmente un marco de comprensión de video personalizado combinando diferentes módulos.
Apoya cinco tareas principales de comprensión de video : MMACTION2 implementa varios algoritmos para múltiples tareas de comprensión de video, incluida el reconocimiento de acción, la localización de la acción, la detección de acción espacio-temporal, la detección de acción basada en esqueletos y la recuperación de videos.
Bien probado y documentado : proporcionamos documentación detallada y referencia de API, así como pruebas unitarias.

Instalación?

MMACTION2 depende de Pytorch, MMCV, MMEngine, MmDetection (Opcional) y MMPose (opcional).

Consulte Install.md para obtener instrucciones detalladas.

Instrucciones rápidas

conda create --name openmmlab python=3.8 -y
conda activate openmmlab
conda install pytorch torchvision -c pytorch  # This command will automatically install the latest version PyTorch and cudatoolkit, please check whether they match your environment.
pip install -U openmim
mim install mmengine
mim install mmcv
mim install mmdet  # optional
mim install mmpose  # optional
git clone https://github.com/open-mmlab/mmaction2.git
cd mmaction2
pip install -v -e .

? Zoológico modelo?

Los resultados y los modelos están disponibles en el zoológico del modelo.

Modelo compatible

Reconocimiento de acción
C3D (CVPR'2014)	TSN (ECCV'2016)	I3D (CVPR'2017)	C2D (CVPR'2018)	I3D no local (CVPR'2018)
R (2+1) D (CVPR'2018)	TRN (ECCV'2018)	TSM (ICCV'2019)	TSM no local (ICCV'2019)	Slowonly (ICCV'2019)
Slowfast (ICCV'2019)	CSN (ICCV'2019)	Lata (aaai'2020)	TPN (CVPR'2020)	X3D (CVPR'2020)
Multimodalidad: Audio (ARXIV'2020)	Taneta (arxiv'2020)	Timesformer (ICML'2021)	ActionClip (ARXIV'2021)	Videoswin (CVPR'2022)
Videomae (Neurips'2022)	MVIT V2 (CVPR'2022)	Uniformador V1 (ICLR'2022)	Uniformador V2 (ARXIV'2022)	Videomae V2 (CVPR'2023)
Localización de acción
BSN (ECCV'2018)	BMN (ICCV'2019)	TCANET (CVPR'2021)
Detección de acción espacio-temporal
ACRN (ECCV'2018)	SlowOnly+Fast R-CNN (ICCV'2019)	Slowfast+Fast R-CNN (ICCV'2019)	LFB (CVPR'2019)	Videomae (Neurips'2022)
Reconocimiento de acción basado en esqueleto
ST-GCN (AAAI'2018)	2S-AGCN (CVPR'2019)	POSEC3D (CVPR'2022)	STGCN ++ (ARXIV'2022)	CTRGCN (CVPR'2021)
MSG3D (CVPR'2020)
Recuperación de videos
Clip4clip (arxiv'2022)

Conjunto de datos compatible

Reconocimiento de acción
HMDB51 (página de inicio) (ICCV'2011)	UCF101 (página de inicio) (CRCV-IR-12-01)	ActivityNet (página de inicio) (CVPR'2015)	Cinética- [400/600/700] (página de inicio) (CVPR'2017)
STHV1 (ICCV'2017)	STHV2 (página de inicio) (ICCV'2017)	Diving48 (página de inicio) (ECCV'2018)	Jester (página de inicio) (ICCV'2019)
Momentos en el tiempo (página de inicio) (TPAMI'2019)	Mótanos en el tiempo (página de inicio) (ARXIV'2019)	HVU (página de inicio) (ECCV'2020)	Omnisource (página de inicio) (ECCV'2020)
FineGym (página de inicio) (CVPR'2020)	Kinetics-710 (página de inicio) (ARXIV'2022)
Localización de acción
Thumos14 (Página de inicio) (Thumos Challenge 2014)	ActivityNet (página de inicio) (CVPR'2015)	HACS (página de inicio) (ICCV'2019)
Detección de acción espacio-temporal
UCF101-24* (página de inicio) (CRCV-IR-12-01)	Jhmdb* (página de inicio) (ICCV'2015)	AVA (página de inicio) (CVPR'2018)	Ava-Kinetics (página de inicio) (ARXIV'2020)
Multiestesports (página de inicio) (ICCV'2021)
Reconocimiento de acción basado en esqueleto
POSEC3D-Finegym (página de inicio) (ARXIV'2021)	POSEC3D-NTURGB+D (página de inicio) (ARXIV'2021)	POSEC3D-UCF101 (página de inicio) (ARXIV'2021)	POSEC3D-HMDB51 (Página de inicio) (ARXIV'2021)
Recuperación de videos
MSRVTT (página de inicio) (CVPR'2016)

? ‍? Empiece?

Para los tutoriales, proporcionamos las siguientes guías de usuario para el uso básico:

Migración de mmaction2 0.x
Aprenda sobre las configuraciones
Preparar conjuntos de datos
Inferencia con los modelos existentes
Entrenamiento y prueba

Investigación de trabajos basados en MMACTION2 por usuarios de la comunidad

Video Swin Transformer. [Documento] [Github]
Aprendizaje profundo evidencial para el reconocimiento de acción abierta, ICCV 2021 oral . [Documento] [Github]
Repensar el aprendizaje de correspondencia auto-supervisado: una perspectiva de similitud de nivel de marco de video, ICCV 2021 oral . [Documento] [Github]

? Licencia?

Este proyecto se publica bajo la licencia Apache 2.0.

Cita?

Si encuentra útil este proyecto en su investigación, considere citar:

 @misc { 2020mmaction2 ,
    title = { OpenMMLab's Next Generation Video Understanding Toolbox and Benchmark } ,
    author = { MMAction2 Contributors } ,
    howpublished = { url{https://github.com/open-mmlab/mmaction2} } ,
    year = { 2020 }
}

? Contribuyendo?

Apreciamos todas las contribuciones para mejorar MMACTION2. Consulte Contriping.MD en MMCV para obtener más detalles sobre la guía contribuyente.

? ¿Reconocimiento?

MMACTION2 es un proyecto de código abierto que contribuyen con investigadores e ingenieros de varias universidades y empresas. Apreciamos a todos los contribuyentes que implementan sus métodos o agregan nuevas características y usuarios que brindan comentarios valiosos. Deseamos que la caja de herramientas y el punto de referencia puedan servir a la creciente comunidad de investigación al proporcionar un conjunto de herramientas flexible para reimplinar los métodos existentes y desarrollar sus nuevos modelos.

¿Proyectos en OpenMMLab?

MMEngine: OpenMMLab Biblioteca fundamental para capacitar a los modelos de aprendizaje profundo.
MMCV: OpenMMLab Biblioteca fundamental para la visión por computadora.
MIM: MIM instala paquetes OpenMMLab.
MMEVAL: una biblioteca de evaluación unificada para múltiples bibliotecas de aprendizaje automático.
MMPretrain: caja de herramientas de pre-entrenamiento OpenMMLab y punto de referencia.
MMDETECTION: OpenMMLab Detection Toolbox and Benchmark.
MMDETECTION3D: la plataforma de próxima generación de OpenMMLab para la detección general de objetos 3D.
MMROTATE: OpenMMLab Caja de herramientas de detección de objetos rotados y punto de referencia.
MMYOLO: OpenMMLab Yolo Series Toolbox y Benchmark.
MMSegmation: OpenMMLab Semantic Segmation Toolbox y Benchmark.
MMOCR: OpenMMLab de texto de texto, reconocimiento y comprensión de la caja de herramientas.
MMPOSE: OpenMMLab Pose Estimation Toolboxbox y Benchmark.
MMHUMAN3D: OpenMMLAB 3D Modelo de herramientas paramétricas humanas y punto de referencia.
MMSelfsup: OpenMMLab Self-Supervised Learning Toolbox and Benchmark.
MMRAZOR: caja de herramientas de compresión del modelo OpenMMLab y punto de referencia.
Mmfewshot: OpenMMLab Smantshot Learning Toolbox and Benchmark.
MMACTION2: la caja de herramientas de comprensión de acción de próxima generación de OpenMMLAB y el punto de referencia.
MMTracking: OpenMMLab Video Perception Toolbox y Benchmark.
MMFLOW: OpenMMLab Flow Toolbox Box y Benchmark.
MMAGIC: Open MM Lab una caja de herramientas de reacción C Dvanced, G en suero e infantil .
MM Generation: OpenMMLab Imagen y Video Generation Models Toolbox.
MMDeploy: marco de implementación del modelo OpenMMLab.
Playground: un centro central para reunir y exhibir proyectos increíbles basados en OpenMMLab.

Expandir

Información adicional

Versión MMAction2 V1.2.0 Release
Tipo Pitón
Fecha de actualización 2025-07-11
tamaño 11.64MB
Proviene de Github

Aplicaciones relacionadas

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
Herramienta de gráficos de datos de código abierto Redash v24.10.0

2024-11-27
datamule python

2024-11-08
plataforma de visualización de datos smartchart v6.9

2024-11-27
Herramienta de prueba de carga de langosta v2.32.0

2024-11-27

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ToDo Co

Pitón

1.0.0
Python Portfolio

Pitón
Herramienta de gráficos de datos de código abierto Redash v24.10.0

Pitón

24.10.0
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo