mmaction2 Download - mmaction2 Download do código fonte

mmaction2

Pitão

MMAction2 V1.2.0 Release

Baixar

Inglês | 简体中文

? Índice

? Índice
? O que há de novo
Introdução
? Principais características
Instalação
? Modelo Zoológico
? ‍? Comece
? Licença
Citação
? Contribuindo
? Reconhecimento
Projetos no OpenMmlab

? O que há de novo ?

A filial padrão foi alterada para main (Anterior 1.x ) do master (atual 0.x ) e incentivamos os usuários a migrar para a versão mais recente com modelos mais suportados, pontos de verificação mais fortes de treinamento e codificação mais simples. Consulte o Guia de Migração para obter mais detalhes.

Release (2023.10.12) : v1.2.0 com os seguintes novos recursos:

Apoie o algoritmo Vindlu Multi-Modality e o treinamento do ActionClip
Suporte modelo leve MobileOne TSN/TSM
Suportar o conjunto de dados de recuperação de vídeo MSVD
Apoie o recurso Slowonly K700 para treinar modelos de localização
Suporte a demos de vídeo e áudio

Introdução?

MMACION2 é uma caixa de ferramentas de código aberto para entendimento de vídeo com base em Pytorch. Faz parte do projeto OpenMmlab.

Reconhecimento de ação no Kinetics-400 (esquerda) e reconhecimento de ação baseado em esqueleto no NTU-RGB+D-120 (direita)

Resultados de detecção e reconhecimento de ação e reconhecimento de ação baseados em esqueleto na Kinetics-400

Resultados da Ação Spatio-Temporal em Ava-2.1

? Principais características?

Design modular : decompomos uma estrutura de entendimento de vídeo em diferentes componentes. Pode -se facilmente construir uma estrutura de compreensão de vídeo personalizada combinando diferentes módulos.
Apoie cinco tarefas principais de compreensão de vídeo : Mmaction2 implementa vários algoritmos para várias tarefas de compreensão de vídeo, incluindo reconhecimento de ação, localização de ações, detecção de ação espaço-temporal, detecção de ação baseada em esqueletos e recuperação de vídeo.
Bem testado e documentado : Fornecemos documentação detalhada e referência da API, bem como testes de unidade.

Instalação?

Mmaction2 depende de Pytorch, MMCV, MMEngine, MmDetection (Opcional) e Mmpose (Opcional).

Consulte o install.md para obter instruções detalhadas.

Instruções rápidas

conda create --name openmmlab python=3.8 -y
conda activate openmmlab
conda install pytorch torchvision -c pytorch  # This command will automatically install the latest version PyTorch and cudatoolkit, please check whether they match your environment.
pip install -U openmim
mim install mmengine
mim install mmcv
mim install mmdet  # optional
mim install mmpose  # optional
git clone https://github.com/open-mmlab/mmaction2.git
cd mmaction2
pip install -v -e .

? Model Zoo?

Resultados e modelos estão disponíveis no zoológico do modelo.

Modelo suportado

Reconhecimento de ação
C3D (CVPR'2014)	TSN (ECCV'2016)	I3d (cvpr'2017)	C2D (CVPR'2018)	I3d não local (CVPR'2018)
R (2+1) D (CVPR'2018)	TRN (ECCV'2018)	TSM (ICCV'2019)	TSM não local (ICCV'2019)	Slowonly (ICCV'2019)
SlowFast (ICCV'2019)	CSN (ICCV'2019)	Estanho (aaai'2020)	TPN (CVPR'2020)	X3D (CVPR'2020)
Multimodalidade: Áudio (Arxiv'2020)	Tanet (Arxiv'2020)	TimesFormer (ICML'2021)	ActionClip (Arxiv'2021)	Vídeo (CVPR'2022)
Videomae (Neurips'2022)	MVIT V2 (CVPR'2022)	Uniformor v1 (iclr'2022)	Uniformer v2 (arxiv'2022)	Videomae V2 (CVPR'2023)
Localização de ação
BSN (ECCV'2018)	BMN (ICCV'2019)	TCANET (CVPR'2021)
Detecção de ação espaço-temporal
ACRN (ECCV'2018)	Slowonly+Fast R-CNN (ICCV'2019)	SlowFast+Fast R-CNN (ICCV'2019)	LFB (CVPR'2019)	Videomae (Neurips'2022)
Reconhecimento de ação baseado em esqueleto
ST-GCN (AAAI'2018)	2S-AGCN (CVPR'2019)	Posec3d (CVPR'2022)	Stgcn ++ (arxiv'2022)	CTRGCN (CVPR'2021)
MSG3D (CVPR'2020)
Recuperação em vídeo
Clip4clip (arxiv'2022)

Conjunto de dados suportado

Reconhecimento de ação
HMDB51 (página inicial) (ICCV'2011)	UCF101 (página inicial) (CRCV-IR-12-01)	AtividadeNet (página inicial) (CVPR'2015)	Cinetics- [400/600/700] (página inicial) (CVPR'2017)
STHV1 (ICCV'2017)	STHV2 (página inicial) (ICCV'2017)	Diving48 (página inicial) (ECCV'2018)	Jester (página inicial) (ICCV'2019)
Momentos no tempo (página inicial) (tpami'2019)	Multimomentos no tempo (página inicial) (Arxiv'2019)	HVU (página inicial) (ECCV'2020)	Omnisource (página inicial) (ECCV'2020)
Finegym (página inicial) (CVPR'2020)	Kinetics-710 (página inicial) (Arxiv'2022)
Localização de ação
Thumos14 (página inicial) (Thumos Challenge 2014)	AtividadeNet (página inicial) (CVPR'2015)	HACS (página inicial) (ICCV'2019)
Detecção de ação espaço-temporal
UCF101-24* (página inicial) (CRCV-IR-12-01)	Jhmdb* (página inicial) (ICCV'2015)	Ava (página inicial) (CVPR'2018)	Ava-Simetics (página inicial) (Arxiv'2020)
Multisports (página inicial) (ICCV'2021)
Reconhecimento de ação baseado em esqueleto
Posec3d-Finegym (página inicial) (Arxiv'2021)	Posec3d-nturgb+d (página inicial) (arxiv'2021)	POSEC3D-UCF101 (página inicial) (Arxiv'2021)	POSEC3D-HMDB51 (página inicial) (Arxiv'2021)
Recuperação em vídeo
MSRVTT (página inicial) (CVPR'2016)

? ‍? Começar?

Para tutoriais, fornecemos os seguintes guias de usuário para uso básico:

Migração de mmaction2 0.x
Aprenda sobre configurações
Prepare conjuntos de dados
Inferência com modelos existentes
Treinamento e teste

Trabalhos de pesquisa construídos no mmaction2 por usuários da comunidade

Video Swin Transformer. [Papel] [Github]
Aprendizagem profunda evidente para reconhecimento de ação de conjunto aberto, ICCV 2021 ORAL . [Papel] [Github]
Repensando o aprendizado de correspondência auto-supervisionada: uma perspectiva de similaridade em nível de vídeo, iccv 2021 oral . [Papel] [Github]

? Licença?

Este projeto é lançado sob a licença Apache 2.0.

Citação?

Se você achar este projeto útil em sua pesquisa, considere citar:

 @misc { 2020mmaction2 ,
    title = { OpenMMLab's Next Generation Video Understanding Toolbox and Benchmark } ,
    author = { MMAction2 Contributors } ,
    howpublished = { url{https://github.com/open-mmlab/mmaction2} } ,
    year = { 2020 }
}

? Contribuindo?

Agradecemos todas as contribuições para melhorar o Mmaction2. Consulte o contribuindo.md no MMCV para obter mais detalhes sobre a diretriz contribuinte.

? Reconhecimento?

O MMACTION2 é um projeto de código aberto que é contribuído por pesquisadores e engenheiros de várias faculdades e empresas. Agradecemos a todos os colaboradores que implementam seus métodos ou adicionam novos recursos e usuários que fornecem feedback valioso. Desejamos que a caixa de ferramentas e a referência possam servir à crescente comunidade de pesquisa, fornecendo um kit de ferramentas flexível para reimplementar os métodos existentes e desenvolver seus novos modelos.

Projetos no OpenMmlab?

Mengine: Biblioteca fundamental OpenMmlab para treinamento de modelos de aprendizado profundo.
MMCV: Biblioteca fundamental do OpenMmlab para visão computacional.
MIM: MIM instala pacotes OpenMmlab.
MMEVal: uma biblioteca de avaliação unificada para várias bibliotecas de aprendizado de máquina.
MMPRETRAIN: OpenMMMLab Pré-treinamento Caixa de ferramentas e benchmark.
MMDETECTION: Caixa de ferramentas de detecção OpenMMLab e referência.
MMDETECTION3D: Plataforma de próxima geração do OpenMmlab para detecção geral de objetos 3D.
MMROTATE: Caixa de ferramentas de detecção de objetos rotacionada OpenMMLab e referência.
MMYOLO: OpenMMMLab YOLO Series Caixa de ferramentas e benchmark.
MMSsegmentation: Caixa de ferramentas de segmentação semântica OpenMMLab e referência.
MMOCR: OpenMMLab Text Detection, Reconhecimento e Caixa de Ferramentas.
MMPOSE: OpenMmlab Pose Estimativa Caixa de ferramentas e referência.
MMHUMAN3D: OpenMMLab 3D Modelo Human Paramétrico Caixa de ferramentas e benchmark.
MMSelfSup: OpenMmlab Caixa de ferramentas de aprendizado auto-supervisionada e referência.
MMRAZOR: OpenMmlab Model Compression Toolbox e Benchmark.
MMFewshot: OpenMmlab FewShot Learning Caixa de ferramentas e referência.
Mmaction2: Ação de próxima geração do OpenMmlab Caixa de ferramentas e benchmark.
MMTRACKING: Caixa de ferramentas de percepção de vídeo OpenMMLab e referência.
MMFlow: OpenMMLab Caixa de ferramentas de fluxo óptico e referência.
Mmagic: Open MM Lab uma caixa de ferramentas de Dvanced, Gerative e Intelligent C Reaction.
MMEGERAÇÃO: OpenMMMLab Image and Video Generative Models Toolbox.
MMDEPLOW: OpenMmlab Model Deployment Framework.
Playground: um centro central para reunir e exibir projetos incríveis construídos no OpenMmlab.

Expandir

Informações adicionais

Versão MMAction2 V1.2.0 Release
Tipo Pitão
Data da Última Atualização 2025-07-11
tamanho 11.64MB
Vindo de Github

Aplicativos Relacionados

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
Ferramenta de gráfico de dados de código aberto Redash v24.10.0

2024-11-27
datamule python

2024-11-08
plataforma de visualização de dados smartchart v6.9

2024-11-27
Ferramenta de teste de carga Locust v2.32.0

2024-11-27

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ToDo Co

Pitão

1.0.0
Python Portfolio

Pitão
Ferramenta de gráfico de dados de código aberto Redash v24.10.0

Pitão

24.10.0
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos