EfficientFormer 다운로드 - EfficientFormer 소스 코드 다운로드

EfficientFormer

파이썬

1.0.0

다운로드

효율적인 포름
_{Mobilenet 크기와 속도를위한 비전 변압기를 다시 생각합니다}

arxiv | PDF

모델은 Imagenet-1K에 대한 교육을 받고 iPhone 12에 CoremlTools와 함께 배치되어 대기 시간을 얻습니다.

Mobilenet 크기와 속도를위한 비전 변압기를 다시 생각합니다
Yanyu Li ^1,2 , Ju Hu ¹ , Yang Wen ¹ , Georgios Evangelidis ¹ , Kamyar Salahi ³ ,
Yanzhi Wang ² , Sergey Tulyakov ¹ , Jian Ren ¹
¹ Snap Inc., ² Northeastern University, ³ UC Berkeley

추상적인

컴퓨터 비전 작업에서 VITS (Vision Transformers)의 성공으로 최근의 예술은 VIT의 성능과 복잡성을 최적화하여 모바일 장치에 효율적인 배포를 가능하게합니다. 주의 메커니즘을 가속화하고, 비효율적 인 설계를 개선하거나, 모바일 친화적 인 경량 컨벤션을 통합하여 하이브리드 아키텍처를 형성하기위한 여러 접근법이 제안됩니다. 그러나 VIT와 그 변형은 여전히 경량 CNN보다 더 높은 대기 시간 또는 상당히 더 많은 매개 변수를 가지고 있으며, 오래된 Mobilenet의 경우에도 마찬가지입니다. 실제로, 대기 시간과 크기는 리소스-제약 하드웨어에 대한 효율적인 배포에 중요합니다. 이 작업에서 우리는 중심 질문을 조사하고 변압기 모델이 Mobilenet만큼 빠르게 실행하고 비슷한 크기를 유지할 수 있습니까? 우리는 VIT의 설계 선택을 다시 방문하고 낮은 대기 시간과 높은 매개 변수 효율로 향상된 슈퍼넷을 제안합니다. 또한 대기 시간과 매개 변수 수를 동시에 최적화하여 효율적인 아키텍처를 찾을 수있는 세밀한 공동 검색 전략을 도입합니다. 제안 된 모델 인 Efficient Formerv2는 유사한 대기 시간 및 매개 변수를 갖는 imageNet-1K에서 Mobilenetv2 및 Mobilenetv2x1.4보다 약 4% 더 높은 상단 1 정확도를 달성합니다. 우리는 올바르게 설계되고 최적화 된 비전 변압기가 Mobilenet 수준 크기와 속도로 고성능을 달성 할 수 있음을 보여줍니다.

교체 및 토 도스

efficientformerv2_s0 , efficientformerv2_s1 , efficientformerv2_s2 및 efficientformerv2_l 포함한 효율성 포맷 버드 모델 패밀리를 추가하십시오.
ImageNet-1K에서 효율적인 Formerv2의 사전 예방 체크 포인트가 해제됩니다.
다운 스트림 작업에서 EngicalFormerv2를 업데이트하십시오 (감지, 세분화).
다운 스트림 작업에서 체크 포인트를 해제합니다.
프로파일 링 및 배포를위한 추가 도구 추가 (Coreml == 5.2 및 Torch == 1.11), 예제 : 사용법 :

 python toolbox.py --model efficientformerv2_l --ckpt weights/eformer_l_450.pth --onnx --coreml

효율적인 성능
_{Mobilenet 속도의 비전 변압기}

arxiv | PDF

모델은 Imagenet-1K에 대한 교육을 받고 iPhone 12에서 CoremlTools로 측정하여 대기 시간을 얻습니다.

효율성 : Mobilenet 속도의 비전 변압기
Yanyu Li ^1,2 , Genge Yuan ^1,2 , Yang Wen ¹ , Eric Hu ¹ , Georgios Evangelidis ¹ ,
Sergey Tulyakov ¹ , Yanzhi Wang ² , Jian Ren ¹
¹ Snap Inc., ² Northeastern University

추상적인

Vision Transformers (VIT)는 컴퓨터 비전 작업에서 급속한 진전을 보여 주어 다양한 벤치 마크에서 유망한 결과를 얻었습니다. 그러나 수많은 매개 변수 및 모델 설계와 같은주의 메커니즘으로 인해 VIT 기반 모델은 일반적으로 경량 컨볼 루션 네트워크보다 속도가 느립니다. 따라서 실시간 애플리케이션을위한 VIT의 배포는 특히 모바일 장치와 같은 자원으로 제한된 하드웨어에서 특히 어려운 일입니다. 최근의 노력은 Mobilenet 블록을 사용하여 네트워크 아키텍처 검색 또는 하이브리드 디자인을 통한 VIT의 계산 복잡성을 줄이려는 노력이지만 추론 속도는 여전히 불만족 스럽습니다. 이것은 중요한 질문으로 이어집니다. 트랜스포머는 고성능을 얻는 동안 Mobilenet만큼 빠르게 작동 할 수 있습니까? 이에 답하기 위해 먼저 VIT 기반 모델에 사용되는 네트워크 아키텍처 및 운영자를 다시 방문하고 비효율적 인 설계를 식별합니다. 그런 다음 디자인 패러다임으로 치수와 일관된 순수 변압기 (Mobilenet 블록이없는)를 소개합니다. 마지막으로, 우리는 대기 시간 중심 슬리밍을 수행하여 효율성이라는 일련의 최종 모델을 얻습니다. 광범위한 실험은 모바일 장치의 성능 및 속도에서 효율적인 성능의 우수성을 보여줍니다. 우리의 가장 빠른 모델 인 EngicalFormer-L1은 iPhone 12에서 1.6ms 추론 대기 시간 (Coreml로 컴파일 된)으로 ImageNet-1K에서 79.2% 상위 1 정확도를 달성합니다. 이는 Mobilenetv2x1.4 (1.6 ms, 74.7% Top-1), Expertencer-L7만큼 빠르게 실행됩니다. 우리의 작업은 적절하게 설계된 변압기가 고성능을 유지하면서 모바일 장치에서 매우 낮은 대기 시간에 도달 할 수 있음을 증명합니다.

imagenet-1k에 대한 분류

모델

모델	상위 1 (300/450)	#Params	Mac	숨어 있음	CKPT	onx	Coreml
효율적인 포름 2-S0	75.7 / 76.2	3.5m	0.40b	0.9ms	S0	S0	S0
효율적인 포름 2-S1	79.0 / 79.7	6.1m	0.65b	1.1ms	S1	S1	S1
효율적인 포름 2-S2	81.6 / 82.0	12.6m	1.25B	1.6ms	S2	S2	S2
효율적인 포름.	83.3 / 83.5	26.1m	2.56b	2.7ms	엘	엘	엘

모델	상위 1 ACC.	숨어 있음	Pytorch 체크 포인트	Coreml	onx
효율적인 성능 L1	79.2 (80.2)	1.6ms	L1-300 (L1-1000)	L1	L1
효율적인 성능 L3	82.4	3.0ms	L3	L3	L3
효율적인 성능 L7	83.3	7.0ms	L7	L7	L7

대기 시간 측정

iPhone 12 (iOS 16) 용 EffCientFormerv2에보고 된 대기 시간은 Xcode 14의 벤치 마크 도구를 사용합니다.

EffcientFormerv1의 경우 Coreml-Performance를 사용합니다. 잘 구현 된 대기 시간 측정에 감사드립니다!

팁 :보고 된 속도를 재현하려면 MacOS+Xcode와 모바일 장치 (iPhone 12)가 필요합니다.

imagenet

전제 조건

conda 가상 환경이 권장됩니다.

 conda install pytorch torchvision cudatoolkit=11.3 -c pytorch
pip install timm
pip install submitit

데이터 준비

http://image-net.org/에서 Imagenet Train 및 Val 이미지를 다운로드하여 추출하십시오. 교육 및 검증 데이터는 각각 train 폴더와 val 폴더에있을 것으로 예상됩니다.

 |-- /path/to/imagenet/
    |-- train
    |-- val

단일 기계 멀티 GPU 교육

Pytorch 분산 데이터 병렬 (DDP)을 사용하여 훈련 스크립트 dist_train.sh 예제를 제공합니다.

8-GPU 기계에서 효율적인 성능 L1을 훈련하려면 :

 sh dist_train.sh efficientformer_l1 8

팁 : 스크립트에서 데이터 경로와 실험 이름을 지정하십시오!

다중 노드 교육

Slurm 관리 클러스터에서는 Dulti-Node Training을 예를 들어 제출을 통해 시작할 수 있습니다.

 sh slurm_train.sh efficientformer_l1

팁 : 리소스를 기반으로 스크립트에서 노드 당 GPUS/CPUS/메모리를 지정하십시오!

테스트

Pytorch 분산 데이터 병렬 (DDP)을 사용하여 예제 테스트 스크립트 dist_test.sh 제공합니다. 예를 들어, 8-GPU 시스템에서 EngicalFormer-L1을 테스트합니다.

 sh dist_test.sh efficientformer_l1 8 weights/efficientformer_l1_300d.pth

효율성을 백본으로 사용합니다

객체 감지 및 인스턴스 분할
시맨틱 세분화

승인

Classification (ImageNet) 코드베이스는 부분적으로 Levit 및 Poolformer로 구축됩니다.

감지 및 분할 파이프 라인은 MMCV (MMDetection 및 Mmsementation)에서 나온 것입니다.

훌륭한 구현에 감사드립니다!

소환

당사의 코드 또는 모델이 귀하의 작업에 도움이되면 효율성 성능 (Neurips 2022) 및 Engicial Formerv2 (ICCV 2023)를 인용하십시오.

 @article { li2022efficientformer ,
  title = { Efficientformer: Vision transformers at mobilenet speed } ,
  author = { Li, Yanyu and Yuan, Geng and Wen, Yang and Hu, Ju and Evangelidis, Georgios and Tulyakov, Sergey and Wang, Yanzhi and Ren, Jian } ,
  journal = { Advances in Neural Information Processing Systems } ,
  volume = { 35 } ,
  pages = { 12934--12949 } ,
  year = { 2022 }
}

 @inproceedings { li2022rethinking ,
  title = { Rethinking Vision Transformers for MobileNet Size and Speed } ,
  author = { Li, Yanyu and Hu, Ju and Wen, Yang and Evangelidis, Georgios and Salahi, Kamyar and Wang, Yanzhi and Tulyakov, Sergey and Ren, Jian } ,
  booktitle = { Proceedings of the IEEE international conference on computer vision } ,
  year = { 2023 }
}

확장하다

추가 정보

버전 1.0.0
유형 파이썬
업데이트 시간 2025-07-12
크기 654.27KB
출처 Github

EfficientFormer

효율적인 포름
_{Mobilenet 크기와 속도를위한 비전 변압기를 다시 생각합니다}

교체 및 토 도스

효율적인 성능
_{Mobilenet 속도의 비전 변압기}

imagenet-1k에 대한 분류

모델

대기 시간 측정

imagenet

전제 조건

데이터 준비

단일 기계 멀티 GPU 교육

다중 노드 교육

테스트

효율성을 백본으로 사용합니다

승인

소환

ToDo Co

Python Portfolio

Redash 오픈 소스 데이터 차트 도구 v24.10.0

datamule python

스마트차트 데이터 시각화 플랫폼 v6.9

Locust 부하 테스트 도구 v2.32.0

chat.petals.dev

GPT Prompt Templates

GPTyped

ToDo Co

Python Portfolio

datamule python

Google Dorks

shepherd

mongo express

EfficientFormer

효율적인 포름 Mobilenet 크기와 속도를위한 비전 변압기를 다시 생각합니다

교체 및 토 도스

효율적인 성능 Mobilenet 속도의 비전 변압기

imagenet-1k에 대한 분류

모델

대기 시간 측정

imagenet

전제 조건

데이터 준비

단일 기계 멀티 GPU 교육

다중 노드 교육

테스트

효율성을 백본으로 사용합니다

승인

소환

효율적인 포름
_{Mobilenet 크기와 속도를위한 비전 변압기를 다시 생각합니다}

효율적인 성능
_{Mobilenet 속도의 비전 변압기}