Téléchargement mmaction2 - Téléchargement du code source mmaction2

mmaction2

Python

MMAction2 V1.2.0 Release

Télécharger

Anglais | 简体中文

? Table des matières

? Table des matières
? Quoi de neuf
Introduction
? Caractéristiques majeures
Installation
? Zoo modèle
? ‍? Commencer
? Licence
Citation
? Contributif
? Reconnaissance
Projets dans OpenMmLab

? Quoi de neuf?

La branche par défaut a été transférée à main ( 1.x précédent) à partir de master (actuel 0.x ), et nous encourageons les utilisateurs à migrer vers la dernière version avec des modèles plus pris en charge, des points de contrôle pré-entraînement plus forts et un codage plus simple. Veuillez vous référer au guide de migration pour plus de détails.

Version (2023.10.12) : v1.2.0 avec les nouvelles fonctionnalités suivantes:

Soutenir l'algorithme multimodalité Vindlu et la formation de l'actionclip
Prise en charge du modèle léger MobileOne TSN / TSM
Prise en charge de l'ensemble de données de récupération vidéo MSVD
Soutenez la fonction Slowonly K700 pour former des modèles de localisation
Prise en charge des démos vidéo et audio

Introduction ?

MMAction2 est une boîte à outils open source pour la compréhension vidéo basée sur Pytorch. Cela fait partie du projet OpenMMLAB.

Reconnaissance d'action sur la cinétique-400 (à gauche) et la reconnaissance d'action basée sur le squelette sur NTU-RGB + D-120 (à droite)

Résultats de détection d'action spatio-temporelle basée sur le squelette et de reconnaissance d'action sur la cinétique-400

Résultats de détection d'action spatio-temporelle sur AVA-2.1

? Caractéristiques majeures?

Conception modulaire : nous décomposons un cadre de compréhension vidéo en différents composants. On peut facilement construire un cadre de compréhension vidéo personnalisé en combinant différents modules.
Prise en charge de cinq tâches de compréhension vidéo principales : MMAction2 implémente divers algorithmes pour plusieurs tâches de compréhension vidéo, notamment la reconnaissance de l'action, la localisation de l'action, la détection d'action spatio-temporelle, la détection d'action basée sur le squelette et la récupération vidéo.
Bien testé et documenté : nous fournissons une documentation détaillée et une référence de l'API, ainsi que des tests unitaires.

Installation?

MMAction2 dépend de pytorch, mmcv, mmengine, mmdection (facultatif) et mMPose (facultatif).

Veuillez vous référer à install.md pour des instructions détaillées.

Instructions rapides

conda create --name openmmlab python=3.8 -y
conda activate openmmlab
conda install pytorch torchvision -c pytorch  # This command will automatically install the latest version PyTorch and cudatoolkit, please check whether they match your environment.
pip install -U openmim
mim install mmengine
mim install mmcv
mim install mmdet  # optional
mim install mmpose  # optional
git clone https://github.com/open-mmlab/mmaction2.git
cd mmaction2
pip install -v -e .

? Modèle Zoo?

Les résultats et les modèles sont disponibles dans le Zoo du modèle.

Modèle pris en charge

Reconnaissance d'action
C3D (CVPR'2014)	TSN (ECCV'2016)	I3d (cvpr'2017)	C2D (CVPR'2018)	I3d non local (CVPR'2018)
R (2 + 1) D (CVPR'2018)	TRN (ECCV'2018)	TSM (ICCV'2019)	TSM non local (ICCV'2019)	Slowonly (ICCV'2019)
Slowfast (ICCV'2019)	CSN (ICCV'2019)	Étain (aaai'2020)	TPN (CVPR'2020)	X3d (CVPR'2020)
Multimodalité: Audio (Arxiv'2020)	TANET (ARXIV'2020)	TimesFormer (ICMl'2021)	ActionClip (Arxiv'2021)	Videoswin (CVPR'2022)
Videomae (Neirips'2022)	MVIT V2 (CVPR'2022)	Uniformer v1 (ICLR'2022)	Uniformer V2 (Arxiv'2022)	Videomae V2 (CVPR'2023)
Localisation d'action
BSN (ECCV'2018)	BMN (ICCV'2019)	TCANET (CVPR'2021)
Détection d'action spatio-temporelle
ACRN (ECCV'2018)	Slowonly + Fast R-CNN (ICCV'2019)	Slowfast + Fast R-CNN (ICCV'2019)	LFB (CVPR'2019)	Videomae (Neirips'2022)
Reconnaissance d'action basée sur le squelette
ST-GCN (AAAI'2018)	2S-AGCN (CVPR'2019)	POSEC3D (CVPR'2022)	STGCN ++ (Arxiv'2022)	CTRGCN (CVPR'2021)
MSG3D (CVPR'2020)
Récupération vidéo
Clip4clip (arXiv'2022)

Ensemble de données pris en charge

Reconnaissance d'action
HMDB51 (page d'accueil) (ICCV'2011)	UCF101 (page d'accueil) (CRCV-IR-12-01)	ActivityNet (page d'accueil) (CVPR'2015)	Kinetics- [400/600/700] (page d'accueil) (CVPR'2017)
STHV1 (ICCV'2017)	STHV2 (page d'accueil) (ICCV'2017)	Diving48 (page d'accueil) (ECCV'2018)	Jester (page d'accueil) (ICCV'2019)
Moments dans le temps (page d'accueil) (tpami'2019)	Multi-moments dans le temps (page d'accueil) (Arxiv'2019)	HVU (page d'accueil) (ECCV'2020)	OmniSource (page d'accueil) (ECCV'2020)
Finegym (page d'accueil) (CVPR'2020)	Kinetics-710 (page d'accueil) (Arxiv'2022)
Localisation d'action
Thumos14 (page d'accueil) (Thumos Challenge 2014)	ActivityNet (page d'accueil) (CVPR'2015)	HACS (page d'accueil) (ICCV'2019)
Détection d'action spatio-temporelle
UCF101-24 * (page d'accueil) (CRCV-IR-12-01)	JHMDB * (page d'accueil) (ICCV'2015)	Ava (page d'accueil) (CVPR'2018)	Ava-kinetics (page d'accueil) (arxiv'2020)
Multisports (page d'accueil) (ICCV'2021)
Reconnaissance d'action basée sur le squelette
Posec3d-finegym (page d'accueil) (arxiv'2021)	Posec3d-nturgb + d (page d'accueil) (arxiv'2021)	POSEC3D-UCF101 (page d'accueil) (Arxiv'2021)	POSEC3D-HMDB51 (page d'accueil) (Arxiv'2021)
Récupération vidéo
MSRVTT (page d'accueil) (CVPR'2016)

? ‍? Commencer?

Pour les tutoriels, nous fournissons les guides utilisateur suivants pour l'utilisation de base:

Migration à partir de mmaction2 0.x
En savoir plus sur les configurations
Préparer des ensembles de données
Inférence avec les modèles existants
Formation et tests

Les travaux de recherche construits sur MMAction2 par des utilisateurs de la communauté

Video Swin Transformer. [papier] [github]
Apprentissage en profondeur d'origine pour la reconnaissance de l'action ouverte, ICCV 2021 oral . [papier] [github]
Repenser l'apprentissage de la correspondance auto-levée: une perspective de similitude au niveau vidéo, ICCV 2021 oral . [papier] [github]

? Licence?

Ce projet est publié sous la licence Apache 2.0.

Citation?

Si vous trouvez ce projet utile dans vos recherches, veuillez envisager citer:

 @misc { 2020mmaction2 ,
    title = { OpenMMLab's Next Generation Video Understanding Toolbox and Benchmark } ,
    author = { MMAction2 Contributors } ,
    howpublished = { url{https://github.com/open-mmlab/mmaction2} } ,
    year = { 2020 }
}

? Contribuant?

Nous apprécions toutes les contributions pour améliorer MMAction2. Veuillez vous référer à contribution.md dans MMCV pour plus de détails sur la directive contributive.

? Reconnaissance?

MMAction2 est un projet open-source qui est apporté par des chercheurs et des ingénieurs de divers collèges et entreprises. Nous apprécions tous les contributeurs qui mettent en œuvre leurs méthodes ou ajoutent de nouvelles fonctionnalités et utilisateurs qui donnent des commentaires précieux. Nous souhaitons que la boîte à outils et la référence puissent servir la communauté de recherche croissante en fournissant une boîte à outils flexible pour réimplémenter les méthodes existantes et développer leurs nouveaux modèles.

Projets dans OpenMmLab?

MMENGINE: Bibliothèque fondamentale OpenMMLAB pour la formation des modèles d'apprentissage en profondeur.
MMCV: Bibliothèque fondamentale OpenMMLab pour la vision par ordinateur.
MIM: MIM installe les packages OpenMmLab.
MMEVAL: une bibliothèque d'évaluation unifiée pour plusieurs bibliothèques d'apprentissage automatique.
MMPRETRAIN: Boîte à outils pré-entraînement OpenMMLAB et benchmark.
MMDETECTION: Boîte à outils de détection OpenMMLAB et benchmark.
MMDETECTION3D: Plateforme de nouvelle génération d'OpenMMLab pour la détection d'objets General 3D.
MMROTATE: Boîte à outils de détection d'objets rotative OpenMMLab et benchmark.
MMYOLO: Boîte à outils et référence OpenMMLAB YOLO Série Yolo.
MmSegmentation: boîte à outils de segmentation sémantique OpenMMLAB et référence.
MMOCR: OpenMmLab Text Detection, Reconnaissance et compréhension de la boîte à outils.
MMPOSE: OpenMMLab Pose Estimation Toolbox et Benchmark.
MMHUMAN3D: OpenMMLab 3D Human Parametric Model Box and Benchmark.
MMelSup: OpenMmlab Auto-supervisé d'apprentissage et référence.
MMRAZOR: boîte à outils de compression du modèle OpenMMLAB et benchmark.
MMFewshot: OpenMmLab FewShot Learning Toolbox et Benchmark.
MMAction2: OpenMMLab Next Genération Action Comprendre la boîte à outils et la référence.
MMTRACKING: OpenMMLab Video Perception Toolbox and Benchmark.
MMFLOW: boîte à outils à débit optique OpenMMLAB et benchmark.
MMAGIC: Open MM Lab a Dvanced, G Enerative et I Ntelligent C Boîte à outils de rérétion C.
MMGENERATION: OpenMMLAB Image et vidéo Modèles génératifs Boîtes à outils.
MMDEPLOY: Framework de déploiement du modèle OpenMMLAB.
Playground: un centre central pour la rassemblement et la présentation de projets incroyables construits sur OpenMmLab.

Développer

Informations supplémentaires

Version MMAction2 V1.2.0 Release
Type Python
Date de mise à jour 2025-07-11
taille 11.64MB
Provenant de Github

Applications connexes

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
Outil de création de graphiques de données open source Redash v24.10.0

2024-11-27
datamule python

2024-11-08
plateforme de visualisation de données smartchart v6.9

2024-11-27
Outil de test de charge acridienne v2.32.0

2024-11-27

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
ToDo Co

Python

1.0.0
Python Portfolio

Python
Outil de création de graphiques de données open source Redash v24.10.0

Python

24.10.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout