Download do FCOS - Download do código -fonte FCOS

FCOS

Pitão

1.0.0

Baixar

FCOS: Detecção de objetos de um estágio totalmente convolucional

Este projeto hospeda o código para implementar o algoritmo FCOS para detecção de objetos, conforme apresentado em nosso artigo:

 FCOS: Fully Convolutional One-Stage Object Detection;
Zhi Tian, Chunhua Shen, Hao Chen, and Tong He;
In: Proc. Int. Conf. Computer Vision (ICCV), 2019.
arXiv preprint arXiv:1904.01355

O papel completo está disponível em: https://arxiv.org/abs/1904.01355.

A implementação baseada no Detectron2 está incluída no Adelaidet.

Um modelo em tempo real com 46fps e 40,3 em AP no Coco Minival também está disponível aqui.

Destaques

Totalmente livre de âncora: os FCOs evitam completamente o cálculo complicado relacionado a caixas de ancoragem e todos os hiper-parâmetros de caixas de ancoragem.
Melhor desempenho: o detector de um estágio muito simples alcança um desempenho muito melhor (38,7 vs. 36,8 em AP com ResNet-50) do que R-CNN mais rápido. Confira mais modelos e resultados experimentais aqui.
Treinamento e teste mais rápidos: com os mesmos hardwares e o backbone resnet-50-fpn, os FCOs também requer menos horas de treinamento (6,5h vs. 8,8h) que o R-CNN mais rápido. O FCOS também leva 12ms a menos tempo de inferência por imagem que o R-CNN mais rápido (44ms vs. 56ms).
Desempenho de última geração: nosso melhor modelo baseado no resnext-64x4d-101 e convoluções deformáveis atingem 49,0% em AP em testes de coco (com testes em várias escalas).

Atualizações

Os FCOs com a pesquisa de arquitetura neural rápida e diversificada (FAD) está disponível no FAD. (30/10/2020)
Script para exportar modelos ONNX. (21/11/2019)
Os novos NMs (ver #165) aceleram modelos baseados em resne (x) T em até 30% e modelos baseados em mobilenet em 40%, com exatamente o mesmo desempenho. Confira aqui. (12/10/2019)
Novos modelos com desempenho muito aprimorado são lançados. O melhor modelo alcança 49% em AP em testes de teste Coco com testes em várias escalas. (11/09/2019)
FCOS com backbones Vovnet estão disponíveis no Vovnet-FCOS. (08/08/2019)
Um truque de usar uma pequena região central do Bbox para o treinamento melhora a AP em quase 1 ponto, como mostrado aqui. (23/07/2019)
FCOS com backbones HRNET estão disponíveis no HRNET-FCOS. (03/07/2019)
Os FCOs com FPN pesquisados automaticamente (R50, R101, ResNext101 e backbones mobileNetv2) estão disponíveis no NAS-FCOS. (30/06/2019)
Os FCOs foram implementados no MMDETECTION. Muito obrigado a @yhcao6 e @hellock. (17/05/2019)

Hardware necessário

Usamos 8 GPUs NVIDIA V100.
Mas 4 1080TI GPUs também podem treinar um FCOS baseado em resnet-50-fpn de pleno direito, já que os FCOs são eficientes em termos de memória.

Instalação

Instalação somente de teste

Para usuários que desejam apenas usar o FCOS como detector de objetos em seus projetos, eles podem instalá -lo por PIP. Para fazer isso, corra:

 pip install torch  # install pytorch if you do not have it
pip install git+https://github.com/tianzhi0549/FCOS.git
# run this command line for a demo 
fcos https://github.com/tianzhi0549/FCOS/raw/master/demo/images/COCO_val2014_000000000885.jpg

Confira aqui o uso da interface.

Para uma instalação completa

Essa implementação do FCOS é baseada na marca MaskRCNN. Portanto, a instalação é a mesma que a benchmark original do MaskRCNN.

Por favor, verifique o install.md para obter instruções de instalação. Você também pode querer ver o readme.md original da benchmark maskrcnn.

Uma demonstração rápida

Depois que a instalação for concluída, você pode seguir as etapas abaixo para executar uma demonstração rápida.

 # assume that you are under the root directory of this project,
# and you have activated your virtual environment if needed.
wget https://huggingface.co/tianzhi/FCOS/resolve/main/FCOS_imprv_R_50_FPN_1x.pth?download=true -O FCOS_imprv_R_50_FPN_1x.pth
python demo/fcos_demo.py

Inferência

A linha de comando de inferência na divisão de Coco Minival:

 python tools/test_net.py 
    --config-file configs/fcos/fcos_imprv_R_50_FPN_1x.yaml 
    MODEL.WEIGHT FCOS_imprv_R_50_FPN_1x.pth 
    TEST.IMS_PER_BATCH 4

Observe que:

Se o nome do seu modelo for diferente, substitua FCOS_imprv_R_50_FPN_1x.pth por seu próprio.
Se você realizar um erro fora da memória, tente reduzir TEST.IMS_PER_BATCH para 1.
Se você deseja avaliar um modelo diferente, mude --config-file para o arquivo de configuração (em Configs/FCOs) e MODEL.WEIGHT em seu arquivo de pesos.
A inferência multi-GPU está disponível, consulte o #78.
Melhoramos a eficiência pós-processo usando NMS com vários rótulos (ver #165), que economiza 18ms em média. A métrica de inferência nas tabelas a seguir foi atualizada de acordo.

Modelos

Para sua conveniência, fornecemos os seguintes modelos treinados (mais modelos estão chegando em breve).

Resne (x) ts:

Todos os modelos baseados em resne (x) são treinados com 16 imagens em uma mini-lote e normalização de lote congelada (ou seja, consistente com os modelos em Maskrcnn_benchmark).

Modelo	Treinamento em várias escalas	Tempo de teste / im	AP (Minival)	Link
FCOS_IMPRV_R_50_FPN_1X	Não	44ms	38.7	download
FCOS_IMPRV_DCNV2_R_50_FPN_1X	Não	54ms	42.3	download
FCOS_IMPRV_R_101_FPN_2X	Sim	57ms	43.0	download
FCOS_IMPRV_DCNV2_R_101_FPN_2X	Sim	73ms	45.6	download
FCOS_IMPRV_X_101_32X8D_FPN_2X	Sim	110ms	44.0	download
FCOS_IMPRV_DCNV2_X_101_32X8D_FPN_2X	Sim	143ms	46.4	download
FCOS_IMPRV_X_101_64X4D_FPN_2X	Sim	112ms	44.7	download
FCOS_IMPRV_DCNV2_X_101_64X4D_FPN_2X	Sim	144ms	46.6	download

Observe que imprv denota improvements em nossa Tabela 3 de papel. Essas alterações quase livres de custo melhoram o desempenho em ~ 1,5% no total. Assim, é altamente recomendável usá -los. A seguir, são apresentados os modelos originais apresentados em nosso artigo inicial.

Modelo	Treinamento em várias escalas	Tempo de teste / im	AP (Minival)	AP (teste-dev)	Link
FCOS_R_50_FPN_1X	Não	45ms	37.1	37.4	download
FCOS_R_101_FPN_2X	Sim	59ms	41.4	41.5	download
FCOS_X_101_32X8D_FPN_2X	Sim	110ms	42.5	42.7	download
FCOS_X_101_64X4D_FPN_2X	Sim	113ms	43.0	43.2	download

Mobilenets:

Atualizamos a normalização do lote para modelos baseados em mobilenet. Se você deseja usar o SyncBN, instale o Pytorch 1.1 ou posterior.

Modelo	TAMANHO DE TREINAMENTO TAMANHO	Treinamento em várias escalas	Tempo de teste / im	AP (Minival)	Link
Fcos_syncbn_bs32_c128_mnv2_fpn_1x	32	Não	26ms	30.9	download
Fcos_syncbn_bs32_mnv2_fpn_1x	32	Não	33ms	33.1	download
Fcos_bn_bs16_mnv2_fpn_1x	16	Não	44ms	31.0	download

[1] 1x e 2x significam que o modelo é treinado para iterações de 90k e 180k, respectivamente.
[2] Todos os resultados são obtidos com um único modelo e sem qualquer aumento de dados de tempo de teste, como multi-escala, inversão e etc.
[3] c128 indica que o modelo possui 128 (em vez de 256) canais em torres (ou seja, MODEL.RESNETS.BACKBONE_OUT_CHANNELS na configuração).
[4] dcnv2 denota redes convolucionais deformáveis v2. Observe que, para modelos baseados em resnet, aplicamos convoluções deformáveis do estágio C3 a C5 nos backbones. Para modelos baseados em resnexo, apenas o estágio C4 e C5 usam convoluções deformáveis. Todos os modelos usam convoluções deformáveis na última camada de torres de detector.
[5] O modelo FCOS_imprv_dcnv2_X_101_64x4d_FPN_2x com testes em várias escalas atinge 49,0% em AP no teste de Coco-Dev. Use TEST.BBOX_AUG.ENABLED True para ativar testes em várias escalas.

Treinamento

A seguinte linha de comando treinará FCOS_IMPRV_R_50_FPN_1X em 8 GPUS com descida de gradiente estocástico síncrono (SGD):

 python -m torch.distributed.launch 
    --nproc_per_node=8 
    --master_port=$((RANDOM + 10000)) 
    tools/train_net.py 
    --config-file configs/fcos/fcos_imprv_R_50_FPN_1x.yaml 
    DATALOADER.NUM_WORKERS 2 
    OUTPUT_DIR training_dir/fcos_imprv_R_50_FPN_1x

Observe que:

Se você deseja usar menos GPUs, altere --nproc_per_node para o número de GPUs. Nenhuma outra configuração precisa ser alterada. O tamanho total do lote não depende do nproc_per_node . Se você deseja alterar o tamanho total do lote, altere SOLVER.IMS_PER_BATCH em configs/fcos/fcos_r_50_fpn_1x.yaml.
Os modelos serão salvos no OUTPUT_DIR .
Se você deseja treinar os FCOs com outros backbones, mude --config-file .
Se você deseja treinar os FCOs no seu próprio conjunto de dados, siga esta instrução #54.
Agora, o treinamento com 8 GPUs e 4 GPUs pode ter o mesmo desempenho. A lacuna de desempenho anterior foi porque não sincronizamos num_pos entre as GPUs ao calcular a perda.

ONNX

Consulte o diretório ONNX para um exemplo de exportação do modelo para o ONNX. Um modelo convertido pode ser baixado aqui. Recomendamos que você use Pytorch> = 1.4.0 (ou noturno) e Torchvision> = 0.5.0 (ou noturno) para modelos ONNX.

Contribuindo para o projeto

Quaisquer solicitações ou problemas de tração são bem -vindos.

Citações

Por favor, considere citar nosso artigo em suas publicações se o projeto ajudar sua pesquisa. A referência Bibtex é a seguinte.

 @inproceedings{tian2019fcos,
  title   =  {{FCOS}: Fully Convolutional One-Stage Object Detection},
  author  =  {Tian, Zhi and Shen, Chunhua and Chen, Hao and He, Tong},
  booktitle =  {Proc. Int. Conf. Computer Vision (ICCV)},
  year    =  {2019}
}

 @article{tian2021fcos,
  title   =  {{FCOS}: A Simple and Strong Anchor-free Object Detector},
  author  =  {Tian, Zhi and Shen, Chunhua and Chen, Hao and He, Tong},
  booktitle =  {IEEE T. Pattern Analysis and Machine Intelligence (TPAMI)},
  year    =  {2021}
}

Agradecimentos

Gostaríamos de agradecer @yqyao pelos truques de amostragem central e giou. Agradecemos também a @Bearcatt por sua sugestão de posicionar o ramo central com regressão de caixa (consulte o #89).

Licença

Para uso acadêmico, este projeto é licenciado sob a licença BSD de 2 cláusulas - consulte o arquivo de licença para obter detalhes. Para uso comercial, entre em contato com os autores.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Pitão
Data da Última Atualização 2025-07-15
tamanho 6.6MB
Vindo de Github

Aplicativos Relacionados

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
datamule python

2024-11-08
Ferramenta de gráfico de dados de código aberto Redash v24.10.0

2024-11-27
plataforma de visualização de dados smartchart v6.9

2024-11-27
Ferramenta de teste de carga Locust v2.32.0

2024-11-27

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
ToDo Co

Pitão

1.0.0
Python Portfolio

Pitão
datamule python

Pitão
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos