External Attention pytorch Download - External Attention pytorch Sumber Code Unduh

China yang disederhanakan | Bahasa inggris

Basis kode FightingCV, termasuk perhatian , tulang punggung , MLP , re-parameter , konvolusi

Halo, semuanya, saya xiaoma

Untuk Xiaobai (seperti saya): Baru -baru ini, saya akan menemukan masalah ketika saya membaca makalah. Terkadang ide inti dari makalah ini sangat sederhana, dan kode inti mungkin hanya selusin baris. Namun, ketika saya membuka kode sumber rilis penulis, saya menemukan bahwa modul yang diusulkan tertanam dalam kerangka kerja tugas seperti klasifikasi, deteksi, dan segmentasi, yang mengarah pada kode yang relatif berlebihan. Saya tidak terbiasa dengan kerangka kerja tugas tertentu dan sulit bagi saya untuk menemukan kode inti , yang mengarah pada kesulitan tertentu dalam memahami makalah dan ide -ide jaringan.

Untuk Advanced (seperti Anda): Jika Anda menganggap unit -unit dasar seperti CONV, FC, dan RNN sebagai blok bangunan Lego kecil, dan struktur seperti Transformer dan Resnet sebagai Kastil Lego yang telah dibangun. Kemudian modul yang disediakan oleh proyek ini adalah komponen Lego dengan informasi semantik lengkap. Biarkan para peneliti ilmiah menghindari membuat roda berulang kali , pikirkan saja tentang cara menggunakan "komponen Lego" ini untuk membangun karya yang lebih berwarna.

Untuk Master (mungkin seperti Anda): Saya memiliki kemampuan terbatas dan tidak suka menyemprotkan dengan ringan ! Lai Lai

Untuk semua: Proyek ini berkomitmen untuk mengimplementasikan basis kode yang memungkinkan pemula pembelajaran mendalam untuk memahami dan melayani penelitian ilmiah dan komunitas industri .

? Sejarah Bintang

menggunakan

Memasang

Pasang langsung melalui PIP

pip install fightingcv-attention

Atau mengkloning repositori

git clone https://github.com/xmu-xiaoma666/External-Attention-pytorch.git

cd External-Attention-pytorch

Demo

Menggunakan pip

 import torch
from torch import nn
from torch . nn import functional as F

# 使用 pip 方式

from fightingcv_attention . attention . MobileViTv2Attention import *

if __name__ == '__main__' :
    input = torch . randn ( 50 , 49 , 512 )
    sa = MobileViTv2Attention ( d_model = 512 )
    output = sa ( input )
    print ( output . shape )

Referensi untuk Menggunakan Modul Paket Pip Built-In: Dokumentasi Perhatian FightingCV

Menggunakan git

 import torch
from torch import nn
from torch . nn import functional as F

# 与 pip方式 区别在于 将 `fightingcv_attention` 替换 `model`

from model . attention . MobileViTv2Attention import *

if __name__ == '__main__' :
    input = torch . randn ( 50 , 49 , 512 )
    sa = MobileViTv2Attention ( d_model = 512 )
    output = sa ( input )
    print ( output . shape )

Daftar isi

Seri Perhatian
- 1. Penggunaan perhatian eksternal
- 2. Penggunaan Perhatian Diri
- 3. Penggunaan perhatian diri yang disederhanakan
- 4. Penggunaan perhatian pemerasan dan eksitasi
- 5. Penggunaan Perhatian SK
- 6. Penggunaan perhatian CBAM
- 7. Penggunaan perhatian BAM
- 8. Penggunaan perhatian ECA
- 9. Penggunaan perhatian Danet
- 10. Penggunaan Piramida Split (PSA)
- 11. Penggunaan Multi-Head Self-Head Efisien (EMSA)
- 12. Mengguncang Penggunaan Perhatian
- 13. Penggunaan Perhatian Muse
- 14. Penggunaan perhatian SGE
- 15. A2 Penggunaan perhatian
- 16. Penggunaan Perhatian Aft
- 17. Penggunaan perhatian Outlook
- 18. Penggunaan perhatian VIP
- 19. Penggunaan Perhatian Coatnet
- 20. Penggunaan Perhatian Halonet
- 21. Penggunaan Perhatian Mandiri terpolarisasi
- 22. Penggunaan Cotattention
- 23. Penggunaan Perhatian Sisa
- 24. S2 Penggunaan perhatian
- 25. Penggunaan perhatian gfnet
- 26. Penggunaan Perhatian Triplet
- 27. Mengkoordinasikan Penggunaan Perhatian
- 28. Penggunaan Perhatian MobileVit
- 29. Penggunaan perhatian Parnet
- 30. Penggunaan perhatian UFO
- 31. Acmix Penggunaan perhatian
- 32. Penggunaan perhatian mobilevitv2
- 33. Penggunaan Dat Perhatian
- 34. Penggunaan perhatian silang
- 35. Penggunaan perhatian Moatransformer
- 36. Penggunaan Perhatian CrisscrossteTention
- 37. Penggunaan perhatian aksial_atensi
Seri Backbone
- 1. Penggunaan Resnet
- 2. Penggunaan Resnext
- 3. Penggunaan MobileVit
- 4. Penggunaan Konvmixer
- 5. Penggunaan Shuffletransformer
- 6. Penggunaan Contnet
- 7. Penggunaan HATNET
- 8. Penggunaan mantel
- 9. Penggunaan Pvt
- 10. Penggunaan CPVT
- 11. Penggunaan Pit
- 12. Penggunaan Crossvit
- 13. Penggunaan TNT
- 14. Penggunaan DVIT
- 15. Penggunaan Ceit
- 16. Mengumpulkan penggunaan
- 17. Penggunaan CAIT
- 18. Penggunaan PatchConvnet
- 19. Penggunaan Deit
- 20. Penggunaan Levit
- 21. Penggunaan VOLO
- 22. Penggunaan Wadah
- 23. Penggunaan CMT
- 24. Penggunaan Efisien
- 25. Penggunaan ConvNextV2
Seri MLP
- 1. Penggunaan Repmlp
- 2. Penggunaan MLP-Mixer
- 3. Penggunaan Resmlp
- 4. Penggunaan GMLP
- 5. Penggunaan SMLP
- 6. Penggunaan VIP-MLP
Seri ulang parameter (rep)
- 1. Penggunaan RepVGG
- 2. Penggunaan Acnet
- 3. Penggunaan Blok Cabang Beragam (DDB)
Seri Konvolusi
- 1. Penggunaan konvolusi yang dapat dipisahkan secara mendalam
- 2. Penggunaan MBCONV
- 3. Penggunaan involusi
- 4. Penggunaan DynamicConv
- 5. Penggunaan CondConv

Seri Perhatian

Implementasi Pytorch dari "Beyond Self-Itention: Perhatian Eksternal Menggunakan Dua Lapisan Linier Untuk Tugas Visual --- Arxiv 2021.05.05"
Implementasi Pytorch dari "Perhatian adalah yang Anda butuhkan --- NIPS2017"
Implementasi Pytorch dari "Jaringan Squeeze-and-Excitation --- CVPR2018"
Implementasi Pytorch dari "Selektif Kernel Networks --- CVPR2019"
Implementasi Pytorch dari "CBAM: Modul Perhatian Blok Konvolusional --- ECCV2018"
Implementasi Pytorch dari "BAM: Modul Perhatian Bottleneck --- BMCV2018"
Implementasi Pytorch dari "ECA-Net: Perhatian Saluran yang Efisien untuk Jaringan Saraf Konvolusional yang Dalam --- CVPR2020"
Pytorch Implementasi "Jaringan Perhatian Ganda untuk Segmentasi Adegan --- CVPR2019"
Implementasi PyTorch dari "Epsanet: Blok Perhatian Pembagi Piramida yang Efisien pada Jaringan Saraf Konvolusi --- ARXIV 2021.05.30"
Implementasi PyTorch dari "Istirahat: Transformator yang efisien untuk pengenalan visual --- ARXIV 2021.05.28"
Implementasi Pytorch dari "SA-NET: Shuffle memperhatikan untuk jaringan saraf konvolusional yang dalam --- ICASSP 2021"
Pytorch Implementasi "Muse: Parallel Multi-Scale Attention untuk urutan ke urutan pembelajaran --- Arxiv 2019.11.17"
Pytorch Implementasi "Peningkatan Grup-Wise Spasial: Meningkatkan Pembelajaran Fitur Semantik Dalam Jaringan Konvolusi --- ARXIV 2019.05.23"
Implementasi PyTorch dari "A2-Nets: Double Attention Networks --- NIPS2018"
Pytorch Implementasi "An Attention Free Transformer --- ICLR2021 (Apple New Work)"
Pytorch Implementasi VOLO: Visi Outlooker untuk Pengenalan Visual --- ArXIV 2021.06.24 "[Analisis Kertas]
Implementasi PyTorch dari Permutator Visi: Arsitektur seperti MLP permutisasi untuk pengenalan visual --- ARXIV 2021.06.23 [Analisis Kertas]
Implementasi Pytorch dari Coatnet: Menikah dengan konvolusi dan perhatian untuk semua ukuran data --- ARXIV 2021.06.09 [Analisis Kertas]
Pytorch Implementasi dari penskalaan perhatian mandiri lokal untuk parameter backbones visual yang efisien --- CVPR2021 oral [analisis kertas]
Implementasi Pytorch dari Polarisasi Sendiri: Menuju Regresi Pixel Berkualitas Tinggi --- ARXIV 2021.07.02 [Analisis Kertas]
Implementasi PyTorch dari jaringan transformator kontekstual untuk pengenalan visual --- ARXIV 2021.07.26 [Analisis kertas]
Pytorch Implementasi Perhatian Residual: Metode yang sederhana namun efektif untuk pengakuan multi-label --- ICCV2021
Implementasi PyTorch dari S²-MLPV2: Peningkatan arsitektur MLP spasial-shift untuk visi --- ARXIV 2021.08.02 [Analisis Kertas]
Pytorch Implementasi Jaringan Filter Global untuk Klasifikasi Gambar --- ARXIV 2021.07.01
Implementasi PyTorch Rotate to Hadir: Modul Perhatian Triplet Konvolusional --- WACV 2021
Implementasi Pytorch dari Koordinat Perhatian untuk Desain Jaringan Seluler yang Efisien --- CVPR 2021
Pytorch Implementasi MobileVit: Light-Weight, General-Purpose, dan Mobile-Friendly Vision Transformer --- ARXIV 2021.10.05
Pytorch Implementasi Jaringan Non-Deep --- ARXIV 2021.10.20
Pytorch Implementasi UFO-VIT: Transformator Visi Linear Kinerja Tinggi Tanpa Softmax --- Arxiv 2021.09.29
Pytorch Implementasi perhatian diri yang dapat dipisahkan untuk transformer visi seluler --- ARXIV 2022.06.06
Pytorch Implementasi tentang integrasi perhatian dan konvolusi diri --- Arxiv 2022.03.14
Pytorch Implementasi Crossformer: Transformator Visi Serbaguna Berengsel pada Perhatian Silang --- ICLR 2022
Pytorch Implementasi agregasi fitur global ke dalam transformator visi lokal
Implementasi Pytorch dari CCNET: Perhatian silang untuk segmentasi semantik
Implementasi Pytorch dari perhatian aksial dalam transformator multidimensi

1. Penggunaan perhatian eksternal

1.1. Kertas

"Di luar perhatian diri: perhatian eksternal menggunakan dua lapisan linier untuk tugas visual"

1.2. Ringkasan

1.3. Kode penggunaan

 from model . attention . ExternalAttention import ExternalAttention
import torch

input = torch . randn ( 50 , 49 , 512 )
ea = ExternalAttention ( d_model = 512 , S = 8 )
output = ea ( input )
print ( output . shape )

2. Penggunaan Perhatian Diri

2.1. Kertas

"Perhatian adalah yang Anda butuhkan"

1.2. Ringkasan

1.3. Kode penggunaan

 from model . attention . SelfAttention import ScaledDotProductAttention
import torch

input = torch . randn ( 50 , 49 , 512 )
sa = ScaledDotProductAttention ( d_model = 512 , d_k = 512 , d_v = 512 , h = 8 )
output = sa ( input , input , input )
print ( output . shape )

3. Penggunaan perhatian diri yang disederhanakan

3.1. Kertas

Tidak ada

3.2. Ringkasan

3.3. Kode penggunaan

 from model . attention . SimplifiedSelfAttention import SimplifiedScaledDotProductAttention
import torch

input = torch . randn ( 50 , 49 , 512 )
ssa = SimplifiedScaledDotProductAttention ( d_model = 512 , h = 8 )
output = ssa ( input , input , input )
print ( output . shape )

4. Penggunaan perhatian pemerasan dan eksitasi

4.1. Kertas

"Jaringan Perasan dan Eksitasi"

4.2. Ringkasan

4.3. Kode penggunaan

 from model . attention . SEAttention import SEAttention
import torch

input = torch . randn ( 50 , 512 , 7 , 7 )
se = SEAttention ( channel = 512 , reduction = 8 )
output = se ( input )
print ( output . shape )

5. Penggunaan Perhatian SK

5.1. Kertas

"Jaringan kernel selektif"

5.2. Ringkasan

5.3. Kode penggunaan

 from model . attention . SKAttention import SKAttention
import torch

input = torch . randn ( 50 , 512 , 7 , 7 )
se = SKAttention ( channel = 512 , reduction = 8 )
output = se ( input )
print ( output . shape )

6. Penggunaan perhatian CBAM

6.1. Kertas

"CBAM: Modul Perhatian Blok Konvolusional"

6.2. Ringkasan

6.3. Kode penggunaan

 from model . attention . CBAM import CBAMBlock
import torch

input = torch . randn ( 50 , 512 , 7 , 7 )
kernel_size = input . shape [ 2 ]
cbam = CBAMBlock ( channel = 512 , reduction = 16 , kernel_size = kernel_size )
output = cbam ( input )
print ( output . shape )

7. Penggunaan perhatian BAM

7.1. Kertas

"BAM: Modul Perhatian Bottleneck"

7.2. Ringkasan

7.3. Kode penggunaan

 from model . attention . BAM import BAMBlock
import torch

input = torch . randn ( 50 , 512 , 7 , 7 )
bam = BAMBlock ( channel = 512 , reduction = 16 , dia_val = 2 )
output = bam ( input )
print ( output . shape )

8. Penggunaan perhatian ECA

8.1. Kertas

"ECA-Net: Perhatian saluran yang efisien untuk jaringan saraf konvolusional yang dalam"

8.2. Ringkasan

8.3. Kode penggunaan

 from model . attention . ECAAttention import ECAAttention
import torch

input = torch . randn ( 50 , 512 , 7 , 7 )
eca = ECAAttention ( kernel_size = 3 )
output = eca ( input )
print ( output . shape )

9. Penggunaan perhatian Danet

9.1. Kertas

"Jaringan perhatian ganda untuk segmentasi adegan"

9.2. Ringkasan

9.3. Kode penggunaan

 from model . attention . DANet import DAModule
import torch

input = torch . randn ( 50 , 512 , 7 , 7 )
danet = DAModule ( d_model = 512 , kernel_size = 3 , H = 7 , W = 7 )
print ( danet ( input ). shape )

10. Penggunaan Penggunaan Pemberitahuan Piramida

10.1. Kertas

"Epsanet: blok perhatian piramida yang efisien pada jaringan saraf konvolusional"

10.2. Ringkasan

10.3. Kode penggunaan

 from model . attention . PSA import PSA
import torch

input = torch . randn ( 50 , 512 , 7 , 7 )
psa = PSA ( channel = 512 , reduction = 8 )
output = psa ( input )
print ( output . shape )

11. Penggunaan Sendiri Multi-Head yang Efisien

11.1. Kertas

"Istirahat: Transformator yang efisien untuk pengenalan visual"

11.2. Ringkasan

11.3. Kode penggunaan

 from model . attention . EMSA import EMSA
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 50 , 64 , 512 )
emsa = EMSA ( d_model = 512 , d_k = 512 , d_v = 512 , h = 8 , H = 8 , W = 8 , ratio = 2 , apply_transform = True )
output = emsa ( input , input , input )
print ( output . shape )

12. Mengguncang Penggunaan Perhatian

12.1. Kertas

"Sa-net: pengocok perhatian untuk jaringan saraf konvolusional yang dalam"

12.2. Ringkasan

12.3. Kode penggunaan

 from model . attention . ShuffleAttention import ShuffleAttention
import torch
from torch import nn
from torch . nn import functional as F


input = torch . randn ( 50 , 512 , 7 , 7 )
se = ShuffleAttention ( channel = 512 , G = 8 )
output = se ( input )
print ( output . shape )

13. Penggunaan Perhatian Muse

13.1. Kertas

"Muse: Perhatian Multi-Skala Paralel untuk Pembelajaran Urutan Urutan"

13.2. Ringkasan

13.3. Kode penggunaan

 from model . attention . MUSEAttention import MUSEAttention
import torch
from torch import nn
from torch . nn import functional as F


input = torch . randn ( 50 , 49 , 512 )
sa = MUSEAttention ( d_model = 512 , d_k = 512 , d_v = 512 , h = 8 )
output = sa ( input , input , input )
print ( output . shape )

14. Penggunaan perhatian SGE

14.1. Kertas

Peningkatan kelompok-bijaksana spasial: Meningkatkan pembelajaran fitur semantik dalam jaringan konvolusional

14.2. Ringkasan

14.3. Kode penggunaan

 from model . attention . SGE import SpatialGroupEnhance
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 50 , 512 , 7 , 7 )
sge = SpatialGroupEnhance ( groups = 8 )
output = sge ( input )
print ( output . shape )

15. A2 Penggunaan perhatian

15.1. Kertas

A2-nets: Jaringan perhatian ganda

15.2. Ringkasan

15.3. Kode penggunaan

 from model . attention . A2Atttention import DoubleAttention
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 50 , 512 , 7 , 7 )
a2 = DoubleAttention ( 512 , 128 , 128 , True )
output = a2 ( input )
print ( output . shape )

16. Penggunaan Perhatian Aft

16.1. Kertas

Transformator bebas perhatian

16.2. Ringkasan

16.3. Kode penggunaan

 from model . attention . AFT import AFT_FULL
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 50 , 49 , 512 )
aft_full = AFT_FULL ( d_model = 512 , n = 49 )
output = aft_full ( input )
print ( output . shape )

17. Penggunaan perhatian Outlook

17.1. Kertas

VOLO: Penglihatan Visi untuk Pengenalan Visual "

17.2. Ringkasan

17.3. Kode penggunaan

 from model . attention . OutlookAttention import OutlookAttention
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 50 , 28 , 28 , 512 )
outlook = OutlookAttention ( dim = 512 )
output = outlook ( input )
print ( output . shape )

18. Penggunaan perhatian VIP

18.1. Kertas

Permutator Visi: Arsitektur seperti MLP yang dapat diijinkan untuk pengakuan visual "

18.2. Ringkasan

18.3. Kode penggunaan

 from model . attention . ViP import WeightedPermuteMLP
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 64 , 8 , 8 , 512 )
seg_dim = 8
vip = WeightedPermuteMLP ( 512 , seg_dim )
out = vip ( input )
print ( out . shape )

19. Penggunaan Perhatian Coatnet

19.1. Kertas

Coatnet: Menikah dengan konvolusi dan perhatian untuk semua ukuran data "

19.2. Ringkasan

Tidak ada

19.3. Kode penggunaan

 from model . attention . CoAtNet import CoAtNet
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 1 , 3 , 224 , 224 )
mbconv = CoAtNet ( in_ch = 3 , image_size = 224 )
out = mbconv ( input )
print ( out . shape )

20. Penggunaan Perhatian Halonet

20.1. Kertas

Menskalakan perhatian diri lokal untuk parameter punggung visual yang efisien "

20.2. Ringkasan

20.3. Kode penggunaan

 from model . attention . HaloAttention import HaloAttention
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 1 , 512 , 8 , 8 )
halo = HaloAttention ( dim = 512 ,
    block_size = 2 ,
    halo_size = 1 ,)
output = halo ( input )
print ( output . shape )

21. Penggunaan Perhatian Mandiri terpolarisasi

21.1. Kertas

Perhatian diri terpolarisasi: Menuju regresi piksel berkualitas tinggi "

21.2. Ringkasan

21.3. Kode penggunaan

 from model . attention . PolarizedSelfAttention import ParallelPolarizedSelfAttention , SequentialPolarizedSelfAttention
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 1 , 512 , 7 , 7 )
psa = SequentialPolarizedSelfAttention ( channel = 512 )
output = psa ( input )
print ( output . shape )

22. Penggunaan Cotattention

22.1. Kertas

Jaringan Transformator Kontekstual untuk Pengenalan Visual --- ARXIV 2021.07.26

22.2. Ringkasan

22.3. Kode penggunaan

 from model . attention . CoTAttention import CoTAttention
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 50 , 512 , 7 , 7 )
cot = CoTAttention ( dim = 512 , kernel_size = 3 )
output = cot ( input )
print ( output . shape )

23. Penggunaan Perhatian Sisa

23.1. Kertas

Perhatian Residual: Metode yang sederhana namun efektif untuk pengakuan multi-label --- ICCV2021

23.2. Ringkasan

23.3. Kode penggunaan

 from model . attention . ResidualAttention import ResidualAttention
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 50 , 512 , 7 , 7 )
resatt = ResidualAttention ( channel = 512 , num_class = 1000 , la = 0.2 )
output = resatt ( input )
print ( output . shape )

24. S2 Penggunaan perhatian

24.1. Kertas

S²-MLPV2: Arsitektur MLP shift spasial yang ditingkatkan untuk Visi --- ARXIV 2021.08.02

24.2. Ringkasan

24.3. Kode penggunaan

 from model . attention . S2Attention import S2Attention
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 50 , 512 , 7 , 7 )
s2att = S2Attention ( channels = 512 )
output = s2att ( input )
print ( output . shape )

25. Penggunaan perhatian gfnet

25.1. Kertas

Jaringan Filter Global untuk Klasifikasi Gambar --- ARXIV 2021.07.01

25.2. Ringkasan

25.3. Kode Penggunaan - Diimplementasikan oleh Wenliang Zhao (Penulis)

 from model . attention . gfnet import GFNet
import torch
from torch import nn
from torch . nn import functional as F

x = torch . randn ( 1 , 3 , 224 , 224 )
gfnet = GFNet ( embed_dim = 384 , img_size = 224 , patch_size = 16 , num_classes = 1000 )
out = gfnet ( x )
print ( out . shape )

26. Penggunaan Tripletattention

26.1. Kertas

ROTATE TO ORGN: Modul Perhatian Triplet Konvolusional --- CVPR 2021

26.2. Ringkasan

26.3. Kode Penggunaan - Diimplementasikan oleh Digantamisra98

 from model . attention . TripletAttention import TripletAttention
import torch
from torch import nn
from torch . nn import functional as F
input = torch . randn ( 50 , 512 , 7 , 7 )
triplet = TripletAttention ()
output = triplet ( input )
print ( output . shape )

27. Mengkoordinasikan Penggunaan Perhatian

27.1. Kertas

Koordinat perhatian untuk desain jaringan seluler yang efisien --- CVPR 2021

27.2. Ringkasan

27.3. Kode Penggunaan - Diimplementasikan oleh Andrew -Qibin

 from model . attention . CoordAttention import CoordAtt
import torch
from torch import nn
from torch . nn import functional as F

inp = torch . rand ([ 2 , 96 , 56 , 56 ])
inp_dim , oup_dim = 96 , 96
reduction = 32

coord_attention = CoordAtt ( inp_dim , oup_dim , reduction = reduction )
output = coord_attention ( inp )
print ( output . shape )

28. Penggunaan Perhatian MobileVit

28.1. Kertas

MobileVit: Transformator penglihatan ringan, serba guna, dan ramah seluler --- Arxiv 2021.10.05

28.2. Ringkasan

28.3. Kode penggunaan

 from model . attention . MobileViTAttention import MobileViTAttention
import torch
from torch import nn
from torch . nn import functional as F

if __name__ == '__main__' :
    m = MobileViTAttention ()
    input = torch . randn ( 1 , 3 , 49 , 49 )
    output = m ( input )
    print ( output . shape )  #output:(1,3,49,49)

29. Penggunaan perhatian Parnet

29.1. Kertas

Jaringan Non-Deep --- ARXIV 2021.10.20

29.2. Ringkasan

29.3. Kode penggunaan

 from model . attention . ParNetAttention import *
import torch
from torch import nn
from torch . nn import functional as F

if __name__ == '__main__' :
    input = torch . randn ( 50 , 512 , 7 , 7 )
    pna = ParNetAttention ( channel = 512 )
    output = pna ( input )
    print ( output . shape ) #50,512,7,7

30. Penggunaan perhatian UFO

30.1. Kertas

UFO-VIT: Transformator penglihatan linier berkinerja tinggi tanpa softmax --- arxiv 2021.09.29

30.2. Ringkasan

30.3. Kode penggunaan

 from model . attention . UFOAttention import *
import torch
from torch import nn
from torch . nn import functional as F

if __name__ == '__main__' :
    input = torch . randn ( 50 , 49 , 512 )
    ufo = UFOAttention ( d_model = 512 , d_k = 512 , d_v = 512 , h = 8 )
    output = ufo ( input , input , input )
    print ( output . shape ) #[50, 49, 512]

31. Acmix Penggunaan perhatian

31.1. Kertas

Tentang integrasi perhatian dan konvolusi diri

31.2. Kode penggunaan

 from model . attention . ACmix import ACmix
import torch

if __name__ == '__main__' :
    input = torch . randn ( 50 , 256 , 7 , 7 )
    acmix = ACmix ( in_planes = 256 , out_planes = 256 )
    output = acmix ( input )
    print ( output . shape )

32. Penggunaan perhatian mobilevitv2

32.1. Kertas

Perhatian diri yang dapat dipisahkan untuk transformator visi seluler --- ARXIV 2022.06.06

32.2. Ringkasan

32.3. Kode penggunaan

 from model . attention . MobileViTv2Attention import MobileViTv2Attention
import torch
from torch import nn
from torch . nn import functional as F

if __name__ == '__main__' :
    input = torch . randn ( 50 , 49 , 512 )
    sa = MobileViTv2Attention ( d_model = 512 )
    output = sa ( input )
    print ( output . shape )

33. Penggunaan Dat Perhatian

33.1. Kertas

Transformer penglihatan dengan perhatian yang dapat dideformasi --- CVPR2022

33.2. Kode penggunaan

 from model . attention . DAT import DAT
import torch

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = DAT (
        img_size = 224 ,
        patch_size = 4 ,
        num_classes = 1000 ,
        expansion = 4 ,
        dim_stem = 96 ,
        dims = [ 96 , 192 , 384 , 768 ],
        depths = [ 2 , 2 , 6 , 2 ],
        stage_spec = [[ 'L' , 'S' ], [ 'L' , 'S' ], [ 'L' , 'D' , 'L' , 'D' , 'L' , 'D' ], [ 'L' , 'D' ]],
        heads = [ 3 , 6 , 12 , 24 ],
        window_sizes = [ 7 , 7 , 7 , 7 ] ,
        groups = [ - 1 , - 1 , 3 , 6 ],
        use_pes = [ False , False , True , True ],
        dwc_pes = [ False , False , False , False ],
        strides = [ - 1 , - 1 , 1 , 1 ],
        sr_ratios = [ - 1 , - 1 , - 1 , - 1 ],
        offset_range_factor = [ - 1 , - 1 , 2 , 2 ],
        no_offs = [ False , False , False , False ],
        fixed_pes = [ False , False , False , False ],
        use_dwc_mlps = [ False , False , False , False ],
        use_conv_patches = False ,
        drop_rate = 0.0 ,
        attn_drop_rate = 0.0 ,
        drop_path_rate = 0.2 ,
    )
    output = model ( input )
    print ( output [ 0 ]. shape )

34. Penggunaan perhatian silang

34.1. Kertas

Crossformer: Transformator visi serbaguna yang berengsel pada perhatian silang --- ICLR 2022

34.2. Kode penggunaan

 from model . attention . Crossformer import CrossFormer
import torch

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = CrossFormer ( img_size = 224 ,
        patch_size = [ 4 , 8 , 16 , 32 ],
        in_chans = 3 ,
        num_classes = 1000 ,
        embed_dim = 48 ,
        depths = [ 2 , 2 , 6 , 2 ],
        num_heads = [ 3 , 6 , 12 , 24 ],
        group_size = [ 7 , 7 , 7 , 7 ],
        mlp_ratio = 4. ,
        qkv_bias = True ,
        qk_scale = None ,
        drop_rate = 0.0 ,
        drop_path_rate = 0.1 ,
        ape = False ,
        patch_norm = True ,
        use_checkpoint = False ,
        merge_size = [[ 2 , 4 ], [ 2 , 4 ], [ 2 , 4 ]]
    )
    output = model ( input )
    print ( output . shape )

35. Penggunaan perhatian Moatransformer

35.1. Kertas

Mengumpulkan fitur global ke dalam transformator visi lokal

35.2. Kode penggunaan

 from model . attention . MOATransformer import MOATransformer
import torch

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = MOATransformer (
        img_size = 224 ,
        patch_size = 4 ,
        in_chans = 3 ,
        num_classes = 1000 ,
        embed_dim = 96 ,
        depths = [ 2 , 2 , 6 ],
        num_heads = [ 3 , 6 , 12 ],
        window_size = 14 ,
        mlp_ratio = 4. ,
        qkv_bias = True ,
        qk_scale = None ,
        drop_rate = 0.0 ,
        drop_path_rate = 0.1 ,
        ape = False ,
        patch_norm = True ,
        use_checkpoint = False
    )
    output = model ( input )
    print ( output . shape )

36. Penggunaan Perhatian CrisscrossteTention

36.1. Kertas

CCNET: Perhatian silang untuk segmentasi semantik

36.2. Kode penggunaan

 from model . attention . CrissCrossAttention import CrissCrossAttention
import torch

if __name__ == '__main__' :
    input = torch . randn ( 3 , 64 , 7 , 7 )
    model = CrissCrossAttention ( 64 )
    outputs = model ( input )
    print ( outputs . shape )

37. Penggunaan perhatian aksial_atensi

37.1. Kertas

Perhatian aksial pada transformator multidimensi

37.2. Kode penggunaan

 from model . attention . Axial_attention import AxialImageTransformer
import torch

if __name__ == '__main__' :
    input = torch . randn ( 3 , 128 , 7 , 7 )
    model = AxialImageTransformer (
        dim = 128 ,
        depth = 12 ,
        reversible = True
    )
    outputs = model ( input )
    print ( outputs . shape )

Seri Backbone

Pytorch Implementasi "Pembelajaran Residual Mendalam Untuk Pengenalan Gambar --- CVPR2016 Kertas Terbaik"
Implementasi Pytorch dari "Transformasi Residual Tergantung untuk Jaringan Saraf Deep --- CVPR2017"
Pytorch Implementasi MobileVit: Light-Weight, General-Purpose, dan Mobile-Friendly Vision Transformer --- ARXIV 2020.10.05
Implementasi tambalan PyTorch adalah semua yang Anda butuhkan? --- ICLR2022 (sedang ditinjau)
Pytorch Implementasi Transformator Shuffle: Memikirkan Kembali Shuffle Spasial Untuk Visi Transformator --- Arxiv 2021.06.07
Implementasi PyTorch dari Contnet: Mengapa tidak menggunakan konvolusi dan transformator pada saat yang sama? --- Arxiv 2021.04.27
Pytorch Implementasi Transformer Visi dengan Perhatian Hirarkis --- Arxiv 2022.06.15
Pytorch Implementasi Transformer Gambar Konvensional CONSAL --- ARXIV 2021.08.26
Pytorch Implementasi Pengkodean Posisi Bersyarat untuk Transformator Visi
Pytorch Implementasi Memikirkan Kembali Dimensi Spasial Transformer Visi --- ICCV 2021
Implementasi PyTorch dari CrossVit: Transformator Visi Multi-Skala Silang untuk Klasifikasi Gambar --- ICCV 2021
Implementasi transformator Pytorch dalam Transformer --- Neurips 2021
Pytorch Implementasi DeepVit: Menuju Transformator Visi yang Lebih Depan
Implementasi Pytorch dari menggabungkan desain konvolusi ke dalam transformator visual

Implementasi PyTorch dari Konvitasi: Meningkatkan Transformer Visi dengan Bias Induktif Konvolusional Soft
Implementasi Pytorch dari Augmenting Networks Convolutional Dengan Agregasi Berbasis Perhatian
Implementasi PyTorch lebih dalam dengan transformator gambar --- ICCV 2021 (oral)
PyTorch Implementasi Transformer Gambar Efisien Data & Distilasi melalui Perhatian --- ICML 2021
Implementasi Levit Pytorch: Transformator Visi dalam Pakaian Convnet untuk Inferensi Lebih Cepat
Pytorch Implementasi VOLO: Visi Outlooker untuk Pengakuan Visual
Implementasi Pytorch dari Container: Konteks Agregasi Jaringan --- Neuips 2021
Pytorch Implementasi CMT: Jaringan Saraf Konvolusional Memenuhi Transformer Visi --- CVPR 2022
Pytorch Implementasi Transformator Visi dengan Perhatian Deformable --- CVPR 2022
Implementasi Pytorch dari Efisiensi: Visi Transformer dengan kecepatan MobileNet
Implementasi PyTorch dari ConvNextV2: Con-desain dan penskalaan convnet dengan autoencoder bertopeng

1. Penggunaan Resnet

1.1. Kertas

"Pembelajaran Residual yang Dalam untuk Pengenalan Gambar --- CVPR2016 Paper Terbaik"

1.2. Ringkasan

1.3. Kode penggunaan

 from model . backbone . resnet import ResNet50 , ResNet101 , ResNet152
import torch
if __name__ == '__main__' :
    input = torch . randn ( 50 , 3 , 224 , 224 )
    resnet50 = ResNet50 ( 1000 )
    # resnet101=ResNet101(1000)
    # resnet152=ResNet152(1000)
    out = resnet50 ( input )
    print ( out . shape )

2. Penggunaan Resnext

2.1. Kertas

"Transformasi residual agregat untuk jaringan saraf dalam --- CVPR2017"

2.2. Ringkasan

2.3. Kode penggunaan

 from model . backbone . resnext import ResNeXt50 , ResNeXt101 , ResNeXt152
import torch

if __name__ == '__main__' :
    input = torch . randn ( 50 , 3 , 224 , 224 )
    resnext50 = ResNeXt50 ( 1000 )
    # resnext101=ResNeXt101(1000)
    # resnext152=ResNeXt152(1000)
    out = resnext50 ( input )
    print ( out . shape )

3. Penggunaan MobileVit

3.1. Kertas

MobileVit: Transformator penglihatan ringan, serba guna, dan ramah seluler --- Arxiv 2020.10.05

3.2. Ringkasan

3.3. Kode penggunaan

 from model . backbone . MobileViT import *
import torch
from torch import nn
from torch . nn import functional as F

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )

    ### mobilevit_xxs
    mvit_xxs = mobilevit_xxs ()
    out = mvit_xxs ( input )
    print ( out . shape )

    ### mobilevit_xs
    mvit_xs = mobilevit_xs ()
    out = mvit_xs ( input )
    print ( out . shape )


    ### mobilevit_s
    mvit_s = mobilevit_s ()
    out = mvit_s ( input )
    print ( out . shape )

4. Penggunaan Konvmixer

4.1. Kertas

Patch adalah semua yang Anda butuhkan? --- ICLR2022 (sedang ditinjau)

4.2. Ringkasan

4.3. Kode penggunaan

 from model . backbone . ConvMixer import *
import torch
from torch import nn
from torch . nn import functional as F

if __name__ == '__main__' :
    x = torch . randn ( 1 , 3 , 224 , 224 )
    convmixer = ConvMixer ( dim = 512 , depth = 12 )
    out = convmixer ( x )
    print ( out . shape )  #[1, 1000]

5. Penggunaan Shuffletransformer

5.1. Kertas

Shuffle Transformer: Memikirkan Kembali Shuffle Spasial untuk Transformator Visi

5.2. Kode penggunaan

 from model . backbone . ShuffleTransformer import ShuffleTransformer
import torch
from torch import nn
from torch . nn import functional as F

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    sft = ShuffleTransformer ()
    output = sft ( input )
    print ( output . shape )

6. Penggunaan Contnet

6.1. Kertas

CONTNET: Mengapa tidak menggunakan konvolusi dan transformator secara bersamaan?

6.2. Kode penggunaan

 from model . backbone . ConTNet import ConTNet
import torch
from torch import nn
from torch . nn import functional as F

if __name__ == "__main__" :
    model = build_model ( use_avgdown = True , relative = True , qkv_bias = True , pre_norm = True )
    input = torch . randn ( 1 , 3 , 224 , 224 )
    out = model ( input )
    print ( out . shape )

7 Penggunaan Hatnet

7.1. Kertas

Visi Transformer dengan perhatian hierarkis

7.2. Kode penggunaan

 from model . backbone . HATNet import HATNet
import torch
from torch import nn
from torch . nn import functional as F

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    hat = HATNet ( dims = [ 48 , 96 , 240 , 384 ], head_dim = 48 , expansions = [ 8 , 8 , 4 , 4 ],
        grid_sizes = [ 8 , 7 , 7 , 1 ], ds_ratios = [ 8 , 4 , 2 , 1 ], depths = [ 2 , 2 , 6 , 3 ])
    output = hat ( input )
    print ( output . shape )

8 penggunaan mantel

8.1. Kertas

Transformator gambar con-scale con-conentS

8.2. Kode penggunaan

 from model . backbone . CoaT import CoaT
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = CoaT ( patch_size = 4 , embed_dims = [ 152 , 152 , 152 , 152 ], serial_depths = [ 2 , 2 , 2 , 2 ], parallel_depth = 6 , num_heads = 8 , mlp_ratios = [ 4 , 4 , 4 , 4 ])
    output = model ( input )
    print ( output . shape ) # torch.Size([1, 1000])

9 Penggunaan Pvt

9.1. Kertas

PVT V2: Baseline yang ditingkatkan dengan transformator penglihatan piramida

9.2. Kode penggunaan

 from model . backbone . PVT import PyramidVisionTransformer
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = PyramidVisionTransformer (
        patch_size = 4 , embed_dims = [ 64 , 128 , 320 , 512 ], num_heads = [ 1 , 2 , 5 , 8 ], mlp_ratios = [ 8 , 8 , 4 , 4 ], qkv_bias = True ,
        norm_layer = partial ( nn . LayerNorm , eps = 1e-6 ), depths = [ 2 , 2 , 2 , 2 ], sr_ratios = [ 8 , 4 , 2 , 1 ])
    output = model ( input )
    print ( output . shape )

10 Penggunaan CPVT

10.1. Kertas

Pengkodean posisi bersyarat untuk transformator penglihatan

10.2. Kode penggunaan

 from model . backbone . CPVT import CPVTV2
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = CPVTV2 (
        patch_size = 4 , embed_dims = [ 64 , 128 , 320 , 512 ], num_heads = [ 1 , 2 , 5 , 8 ], mlp_ratios = [ 8 , 8 , 4 , 4 ], qkv_bias = True ,
        norm_layer = partial ( nn . LayerNorm , eps = 1e-6 ), depths = [ 3 , 4 , 6 , 3 ], sr_ratios = [ 8 , 4 , 2 , 1 ])
    output = model ( input )
    print ( output . shape )

11 Penggunaan Pit

11.1. Kertas

Memikirkan kembali dimensi spasial transformator penglihatan

11.2. Kode penggunaan

 from model . backbone . PIT import PoolingTransformer
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = PoolingTransformer (
        image_size = 224 ,
        patch_size = 14 ,
        stride = 7 ,
        base_dims = [ 64 , 64 , 64 ],
        depth = [ 3 , 6 , 4 ],
        heads = [ 4 , 8 , 16 ],
        mlp_ratio = 4
    )
    output = model ( input )
    print ( output . shape )

12 Penggunaan Crossvit

12.1. Kertas

CrossVit: Transformator visi multi-skala silang untuk klasifikasi gambar

12.2. Kode penggunaan

 from model . backbone . CrossViT import VisionTransformer
import torch
from torch import nn

if __name__ == "__main__" :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = VisionTransformer (
        img_size = [ 240 , 224 ],
        patch_size = [ 12 , 16 ], 
        embed_dim = [ 192 , 384 ], 
        depth = [[ 1 , 4 , 0 ], [ 1 , 4 , 0 ], [ 1 , 4 , 0 ]],
        num_heads = [ 6 , 6 ], 
        mlp_ratio = [ 4 , 4 , 1 ], 
        qkv_bias = True ,
        norm_layer = partial ( nn . LayerNorm , eps = 1e-6 )
    )
    output = model ( input )
    print ( output . shape )

13 Penggunaan TNT

13.1. Kertas

Transformator dalam transformator

13.2. Kode penggunaan

 from model . backbone . TnT import TNT
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = TNT (
        img_size = 224 , 
        patch_size = 16 , 
        outer_dim = 384 , 
        inner_dim = 24 , 
        depth = 12 ,
        outer_num_heads = 6 , 
        inner_num_heads = 4 , 
        qkv_bias = False ,
        inner_stride = 4 )
    output = model ( input )
    print ( output . shape )

14 Penggunaan DVIT

14.1. Kertas

DeepVit: Menuju Transformator Visi yang lebih dalam

14.2. Kode penggunaan

 from model . backbone . DViT import DeepVisionTransformer
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = DeepVisionTransformer (
        patch_size = 16 , embed_dim = 384 , 
        depth = [ False ] * 16 , 
        apply_transform = [ False ] * 0 + [ True ] * 32 , 
        num_heads = 12 , 
        mlp_ratio = 3 , 
        qkv_bias = True ,
        norm_layer = partial ( nn . LayerNorm , eps = 1e-6 ),
        )
    output = model ( input )
    print ( output . shape )

15 Penggunaan CEIT

15.1. Kertas

Menggabungkan desain konvolusi ke dalam transformator visual

15.2. Kode penggunaan

 from model . backbone . CeiT import CeIT
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = CeIT (
        hybrid_backbone = Image2Tokens (),
        patch_size = 4 , 
        embed_dim = 192 , 
        depth = 12 , 
        num_heads = 3 , 
        mlp_ratio = 4 , 
        qkv_bias = True ,
        norm_layer = partial ( nn . LayerNorm , eps = 1e-6 )
        )
    output = model ( input )
    print ( output . shape )

16 Mengumpulkan penggunaan

16.1. Kertas

Konvit: Meningkatkan transformator penglihatan dengan bias induktif konvolusional lunak

16.2. Kode penggunaan

 from model . backbone . ConViT import VisionTransformer
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = VisionTransformer (
        num_heads = 16 ,
        norm_layer = partial ( nn . LayerNorm , eps = 1e-6 )
        )
    output = model ( input )
    print ( output . shape )

17 Penggunaan Cait

17.1. Kertas

Semakin dalam dengan transformator gambar

17.2. Kode penggunaan

 from model . backbone . CaiT import CaiT
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = CaiT (
        img_size = 224 ,
        patch_size = 16 , 
        embed_dim = 192 , 
        depth = 24 , 
        num_heads = 4 , 
        mlp_ratio = 4 , 
        qkv_bias = True ,
        norm_layer = partial ( nn . LayerNorm , eps = 1e-6 ),
        init_scale = 1e-5 ,
        depth_token_only = 2
        )
    output = model ( input )
    print ( output . shape )

18 Penggunaan PatchConVNet

18.1. Kertas

Menambah jaringan konvolusional dengan agregasi berbasis perhatian

18.2. Kode penggunaan

 from model . backbone . PatchConvnet import PatchConvnet
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = PatchConvnet (
        patch_size = 16 ,
        embed_dim = 384 ,
        depth = 60 ,
        num_heads = 1 ,
        qkv_bias = True ,
        norm_layer = partial ( nn . LayerNorm , eps = 1e-6 ),
        Patch_layer = ConvStem ,
        Attention_block = Conv_blocks_se ,
        depth_token_only = 1 ,
        mlp_ratio_clstk = 3.0 ,
    )
    output = model ( input )
    print ( output . shape )

19 Penggunaan Deit

19.1. Kertas

Melatih transformator gambar yang efisien data & distilasi melalui perhatian

19.2. Kode penggunaan

 from model . backbone . DeiT import DistilledVisionTransformer
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = DistilledVisionTransformer (
        patch_size = 16 , 
        embed_dim = 384 , 
        depth = 12 , 
        num_heads = 6 , 
        mlp_ratio = 4 , 
        qkv_bias = True ,
        norm_layer = partial ( nn . LayerNorm , eps = 1e-6 )
        )
    output = model ( input )
    print ( output [ 0 ]. shape )

20 Penggunaan Levit

20.1. Kertas

Levit: Transformator penglihatan dalam pakaian Convnet untuk inferensi yang lebih cepat

20.2. Kode penggunaan

 from model . backbone . LeViT import *
import torch
from torch import nn

if __name__ == '__main__' :
    for name in specification :
        input = torch . randn ( 1 , 3 , 224 , 224 )
        model = globals ()[ name ]( fuse = True , pretrained = False )
        model . eval ()
        output = model ( input )
        print ( output . shape )

21 Penggunaan Volo

21.1. Kertas

VOLO: Penglihatan Visi untuk Pengenalan Visual

21.2. Kode penggunaan

 from model . backbone . VOLO import VOLO
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = VOLO ([ 4 , 4 , 8 , 2 ],
                 embed_dims = [ 192 , 384 , 384 , 384 ],
                 num_heads = [ 6 , 12 , 12 , 12 ],
                 mlp_ratios = [ 3 , 3 , 3 , 3 ],
                 downsamples = [ True , False , False , False ],
                 outlook_attention = [ True , False , False , False ],
                 post_layers = [ 'ca' , 'ca' ],
                 )
    output = model ( input )
    print ( output [ 0 ]. shape )

22 Penggunaan Kontainer

22.1. Kertas

Container: Jaringan Agregasi Konteks

22.2. Kode penggunaan

 from model . backbone . Container import VisionTransformer
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = VisionTransformer (
        img_size = [ 224 , 56 , 28 , 14 ], 
        patch_size = [ 4 , 2 , 2 , 2 ], 
        embed_dim = [ 64 , 128 , 320 , 512 ], 
        depth = [ 3 , 4 , 8 , 3 ], 
        num_heads = 16 , 
        mlp_ratio = [ 8 , 8 , 4 , 4 ], 
        qkv_bias = True ,
        norm_layer = partial ( nn . LayerNorm , eps = 1e-6 ))
    output = model ( input )
    print ( output . shape )

23 Penggunaan CMT

23.1. Kertas

CMT: Jaringan saraf konvolusional memenuhi transformator visi

23.2. Kode penggunaan

 from model . backbone . CMT import CMT_Tiny
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = CMT_Tiny ()
    output = model ( input )
    print ( output [ 0 ]. shape )

24 Penggunaan Efisien

24.1. Kertas

EfisienFormer: Visi Transformers dengan kecepatan mobileNet

24.2. Kode penggunaan

 from model . backbone . EfficientFormer import EfficientFormer
import torch
from torch import nn

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = EfficientFormer (
        layers = EfficientFormer_depth [ 'l1' ],
        embed_dims = EfficientFormer_width [ 'l1' ],
        downsamples = [ True , True , True , True ],
        vit_num = 1 ,
    )
    output = model ( input )
    print ( output [ 0 ]. shape )

25 Penggunaan ConvNextV2

25.1. Kertas

ConvNextV2: co-desain dan penskalaan konvnet dengan autoencoders bertopeng

25.2. Kode penggunaan

 from model . backbone . convnextv2 import convnextv2_atto
import torch
from torch import nn

if __name__ == "__main__" :
    model = convnextv2_atto ()
    input = torch . randn ( 1 , 3 , 224 , 224 )
    out = model ( input )
    print ( out . shape )

Seri MLP

Implementasi PyTorch dari "RepMLP: Konvolusi Parameterisasi ulang menjadi lapisan yang sepenuhnya terhubung untuk pengenalan gambar --- ARXIV 2021.05.05"
Implementasi PyTorch dari "MLP-Mixer: All-MLP Architecture for Vision --- Arxiv 2021.05.17"
Implementasi PyTorch dari "ResMLP: FeedForward Networks untuk Klasifikasi Gambar dengan Pelatihan Efisien Data --- ARXIV 2021.05.07"
Pytorch Implementasi "Perhatikan MLP --- ARXIV 2021.05.17"
Pytorch Implementasi "Jarang MLP untuk Pengenalan Gambar: Apakah Perhatian Mandiri Benar-benar Diperlukan? --- Arxiv 2021.09.12"

1. Penggunaan Repmlp

1.1. Kertas

"RepMLP: RE-Parameterizing Convolutions menjadi lapisan yang sepenuhnya terhubung untuk pengenalan gambar"

1.2. Ringkasan

1.3. Kode penggunaan

 from model . mlp . repmlp import RepMLP
import torch
from torch import nn

N = 4 #batch size
C = 512 #input dim
O = 1024 #output dim
H = 14 #image height
W = 14 #image width
h = 7 #patch height
w = 7 #patch width
fc1_fc2_reduction = 1 #reduction ratio
fc3_groups = 8 # groups
repconv_kernels = [ 1 , 3 , 5 , 7 ] #kernel list
repmlp = RepMLP ( C , O , H , W , h , w , fc1_fc2_reduction , fc3_groups , repconv_kernels = repconv_kernels )
x = torch . randn ( N , C , H , W )
repmlp . eval ()
for module in repmlp . modules ():
    if isinstance ( module , nn . BatchNorm2d ) or isinstance ( module , nn . BatchNorm1d ):
        nn . init . uniform_ ( module . running_mean , 0 , 0.1 )
        nn . init . uniform_ ( module . running_var , 0 , 0.1 )
        nn . init . uniform_ ( module . weight , 0 , 0.1 )
        nn . init . uniform_ ( module . bias , 0 , 0.1 )

#training result
out = repmlp ( x )
#inference result
repmlp . switch_to_deploy ()
deployout = repmlp ( x )

print ((( deployout - out ) ** 2 ). sum ())

2. Penggunaan MLP-Mixer

2.1. Kertas

"MLP-Mixer: All-MLP Architecture for Vision"

2.2. Ringkasan

2.3. Kode penggunaan

 from model . mlp . mlp_mixer import MlpMixer
import torch
mlp_mixer = MlpMixer ( num_classes = 1000 , num_blocks = 10 , patch_size = 10 , tokens_hidden_dim = 32 , channels_hidden_dim = 1024 , tokens_mlp_dim = 16 , channels_mlp_dim = 1024 )
input = torch . randn ( 50 , 3 , 40 , 40 )
output = mlp_mixer ( input )
print ( output . shape )

3. Penggunaan Resmlp

3.1. Kertas

"Resmlp: FeedForward Networks untuk Klasifikasi Gambar dengan Pelatihan Efisien Data"

3.2. Ringkasan

3.3. Kode penggunaan

 from model . mlp . resmlp import ResMLP
import torch

input = torch . randn ( 50 , 3 , 14 , 14 )
resmlp = ResMLP ( dim = 128 , image_size = 14 , patch_size = 7 , class_num = 1000 )
out = resmlp ( input )
print ( out . shape ) #the last dimention is class_num

4. Penggunaan GMLP

4.1. Kertas

"Perhatikan MLP"

4.2. Ringkasan

4.3. Kode penggunaan

 from model . mlp . g_mlp import gMLP
import torch

num_tokens = 10000
bs = 50
len_sen = 49
num_layers = 6
input = torch . randint ( num_tokens ,( bs , len_sen )) #bs,len_sen
gmlp = gMLP ( num_tokens = num_tokens , len_sen = len_sen , dim = 512 , d_ff = 1024 )
output = gmlp ( input )
print ( output . shape )

5. Penggunaan SMLP

5.1. Kertas

"MLP jarang untuk pengenalan gambar: Apakah perhatian diri benar-benar diperlukan?"

5.2. Ringkasan

5.3. Kode penggunaan

 from model . mlp . sMLP_block import sMLPBlock
import torch
from torch import nn
from torch . nn import functional as F

if __name__ == '__main__' :
    input = torch . randn ( 50 , 3 , 224 , 224 )
    smlp = sMLPBlock ( h = 224 , w = 224 )
    out = smlp ( input )
    print ( out . shape )

6. Penggunaan VIP-MLP

6.1. Kertas

"Permutator Visi: Arsitektur seperti MLP yang permutisasi untuk pengakuan visual"

6.2. Kode penggunaan

 from model . mlp . vip - mlp import VisionPermutator
import torch
from torch import nn
from torch . nn import functional as F

if __name__ == '__main__' :
    input = torch . randn ( 1 , 3 , 224 , 224 )
    model = VisionPermutator (
        layers = [ 4 , 3 , 8 , 3 ], 
        embed_dims = [ 384 , 384 , 384 , 384 ], 
        patch_size = 14 , 
        transitions = [ False , False , False , False ],
        segment_dim = [ 16 , 16 , 16 , 16 ], 
        mlp_ratios = [ 3 , 3 , 3 , 3 ], 
        mlp_fn = WeightedPermuteMLP
    )
    output = model ( input )
    print ( output . shape )

Serial-parameter seri

Pytorch Implementasi "REPVGG: Membuat Convnet VGG-Style Hebat Lagi ---- CVPR2021"
Implementasi Pytorch dari "ACNET: Memperkuat kerangka kernel untuk CNN yang kuat melalui blok konvolusi asimetris --- ICCV2019"
Implementasi Pytorch dari "Beragam Blok Cabang: Membangun Konvolusi sebagai Unit seperti Inception --- CVPR2021"

1. Penggunaan RepVGG

1.1. Kertas

"Repvgg: Membuat Convnet VGG-Style Hebat Lagi"

1.2. Ringkasan

1.3. Kode penggunaan

 from model . rep . repvgg import RepBlock
import torch


input = torch . randn ( 50 , 512 , 49 , 49 )
repblock = RepBlock ( 512 , 512 )
repblock . eval ()
out = repblock ( input )
repblock . _switch_to_deploy ()
out2 = repblock ( input )
print ( 'difference between vgg and repvgg' )
print ((( out2 - out ) ** 2 ). sum ())

2. Penggunaan Acnet

2.1. Kertas

"Acnet: Memperkuat kerangka kernel untuk CNN yang kuat melalui blok konvolusi asimetris"

2.2. Ringkasan

2.3. Kode penggunaan

 from model . rep . acnet import ACNet
import torch
from torch import nn

input = torch . randn ( 50 , 512 , 49 , 49 )
acnet = ACNet ( 512 , 512 )
acnet . eval ()
out = acnet ( input )
acnet . _switch_to_deploy ()
out2 = acnet ( input )
print ( 'difference:' )
print ((( out2 - out ) ** 2 ). sum ())

2. Penggunaan blok cabang yang beragam

2.1. Kertas

"Beragam Blok Cabang: Membangun Konvolusi sebagai Unit seperti Inception"

2.2. Ringkasan

2.3. Kode penggunaan

2.3.1 Transform i

 from model . rep . ddb import transI_conv_bn
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 1 , 64 , 7 , 7 )
#conv+bn
conv1 = nn . Conv2d ( 64 , 64 , 3 , padding = 1 )
bn1 = nn . BatchNorm2d ( 64 )
bn1 . eval ()
out1 = bn1 ( conv1 ( input ))

#conv_fuse
conv_fuse = nn . Conv2d ( 64 , 64 , 3 , padding = 1 )
conv_fuse . weight . data , conv_fuse . bias . data = transI_conv_bn ( conv1 , bn1 )
out2 = conv_fuse ( input )

print ( "difference:" ,(( out2 - out1 ) ** 2 ). sum (). item ())

2.3.2 Transformasi II

 from model . rep . ddb import transII_conv_branch
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 1 , 64 , 7 , 7 )

#conv+conv
conv1 = nn . Conv2d ( 64 , 64 , 3 , padding = 1 )
conv2 = nn . Conv2d ( 64 , 64 , 3 , padding = 1 )
out1 = conv1 ( input ) + conv2 ( input )

#conv_fuse
conv_fuse = nn . Conv2d ( 64 , 64 , 3 , padding = 1 )
conv_fuse . weight . data , conv_fuse . bias . data = transII_conv_branch ( conv1 , conv2 )
out2 = conv_fuse ( input )

print ( "difference:" ,(( out2 - out1 ) ** 2 ). sum (). item ())

2.3.3 Transformasi III

 from model . rep . ddb import transIII_conv_sequential
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 1 , 64 , 7 , 7 )

#conv+conv
conv1 = nn . Conv2d ( 64 , 64 , 1 , padding = 0 , bias = False )
conv2 = nn . Conv2d ( 64 , 64 , 3 , padding = 1 , bias = False )
out1 = conv2 ( conv1 ( input ))


#conv_fuse
conv_fuse = nn . Conv2d ( 64 , 64 , 3 , padding = 1 , bias = False )
conv_fuse . weight . data = transIII_conv_sequential ( conv1 , conv2 )
out2 = conv_fuse ( input )

print ( "difference:" ,(( out2 - out1 ) ** 2 ). sum (). item ())

2.3.4 Transform IV

 from model . rep . ddb import transIV_conv_concat
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 1 , 64 , 7 , 7 )

#conv+conv
conv1 = nn . Conv2d ( 64 , 32 , 3 , padding = 1 )
conv2 = nn . Conv2d ( 64 , 32 , 3 , padding = 1 )
out1 = torch . cat ([ conv1 ( input ), conv2 ( input )], dim = 1 )

#conv_fuse
conv_fuse = nn . Conv2d ( 64 , 64 , 3 , padding = 1 )
conv_fuse . weight . data , conv_fuse . bias . data = transIV_conv_concat ( conv1 , conv2 )
out2 = conv_fuse ( input )

print ( "difference:" ,(( out2 - out1 ) ** 2 ). sum (). item ())

2.3.5 Transform v

 from model . rep . ddb import transV_avg
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 1 , 64 , 7 , 7 )

avg = nn . AvgPool2d ( kernel_size = 3 , stride = 1 )
out1 = avg ( input )

conv = transV_avg ( 64 , 3 )
out2 = conv ( input )

print ( "difference:" ,(( out2 - out1 ) ** 2 ). sum (). item ())

2.3.6 Transformasi VI

 from model . rep . ddb import transVI_conv_scale
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 1 , 64 , 7 , 7 )

#conv+conv
conv1x1 = nn . Conv2d ( 64 , 64 , 1 )
conv1x3 = nn . Conv2d ( 64 , 64 ,( 1 , 3 ), padding = ( 0 , 1 ))
conv3x1 = nn . Conv2d ( 64 , 64 ,( 3 , 1 ), padding = ( 1 , 0 ))
out1 = conv1x1 ( input ) + conv1x3 ( input ) + conv3x1 ( input )

#conv_fuse
conv_fuse = nn . Conv2d ( 64 , 64 , 3 , padding = 1 )
conv_fuse . weight . data , conv_fuse . bias . data = transVI_conv_scale ( conv1x1 , conv1x3 , conv3x1 )
out2 = conv_fuse ( input )

print ( "difference:" ,(( out2 - out1 ) ** 2 ). sum (). item ())

Seri Konvolusi

Implementasi PyTorch dari "MobileNets: Efisien Neural Networks untuk Aplikasi Visi Seluler --- CVPR2017"
Implementasi PyTorch dari "EfficientNet: Rethinking Model Scaling untuk Jaringan Saraf Convolutional --- PMLR2019"
Implementasi Pytorch dari "Involution: Membalikkan Warisan Konvolusi untuk Pengenalan Visual ---- CVPR2021"
Implementasi Pytorch dari "Konvolusi Dinamis: Perhatian atas Kernel Konvolusi --- CVPR2020 Oral"
Implementasi Pytorch dari "CondConV: Konvolusi yang diparameterisasi secara kondisional untuk inferensi yang efisien --- Neurips2019"

1. Penggunaan konvolusi yang dapat dipisahkan secara mendalam

1.1. Kertas

"MobileNets: Jaringan saraf konvolusional yang efisien untuk aplikasi penglihatan seluler"

1.2. Ringkasan

1.3. Kode penggunaan

 from model . conv . DepthwiseSeparableConvolution import DepthwiseSeparableConvolution
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 1 , 3 , 224 , 224 )
dsconv = DepthwiseSeparableConvolution ( 3 , 64 )
out = dsconv ( input )
print ( out . shape )

2. Penggunaan MBCONV

2.1. Kertas

"EfficientNet: Memikirkan kembali penskalaan model untuk jaringan saraf konvolusional"

2.2. Ringkasan

2.3. Kode penggunaan

 from model . conv . MBConv import MBConvBlock
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 1 , 3 , 224 , 224 )
mbconv = MBConvBlock ( ksize = 3 , input_filters = 3 , output_filters = 512 , image_size = 224 )
out = mbconv ( input )
print ( out . shape )

3. Penggunaan involusi

3.1. Kertas

"Involution: Membalikkan warisan konvolusi untuk pengakuan visual"

3.2. Ringkasan

3.3. Kode penggunaan

 from model . conv . Involution import Involution
import torch
from torch import nn
from torch . nn import functional as F

input = torch . randn ( 1 , 4 , 64 , 64 )
involution = Involution ( kernel_size = 3 , in_channel = 4 , stride = 2 )
out = involution ( input )
print ( out . shape )

4. Penggunaan DynamicConv

4.1. Kertas

"Konvolusi Dinamis: Perhatian atas Kernel Konvolusi"

4.2. Ringkasan

4.3. Kode penggunaan

 from model . conv . DynamicConv import *
import torch
from torch import nn
from torch . nn import functional as F

if __name__ == '__main__' :
    input = torch . randn ( 2 , 32 , 64 , 64 )
    m = DynamicConv ( in_planes = 32 , out_planes = 64 , kernel_size = 3 , stride = 1 , padding = 1 , bias = False )
    out = m ( input )
    print ( out . shape ) # 2,32,64,64

5. Penggunaan CondConv

5.1. Kertas

"Condconv: Konvolusi yang diparameterisasi secara kondisional untuk inferensi yang efisien"

5.2. Ringkasan

5.3. Kode penggunaan

 from model . conv . CondConv import *
import torch
from torch import nn
from torch . nn import functional as F





if __name__ == '__main__' :
    input = torch . randn ( 2 , 32 , 64 , 64 )
    m = CondConv ( in_planes = 32 , out_planes = 64 , kernel_size = 3 , stride = 1 , padding = 1 , bias = False )
    out = m ( input )
    print ( out . shape )

Rekomendasi proyek lainnya

Berita besar! Lai Lai Sebagai suplemen untuk proyek ini, Anda dapat memperhatikan proyek open source FightingCV-membaca-bacaan , yang mengumpulkan dan mengatur analisis kertas konferensi dan jurnal utama.

Berita besar! Lai Lai Baru-baru ini, saya telah menyusun berbagai tutorial video terkait AI dan makalah yang harus dibaca di internet FightingCV-Course

Berita besar! Lai Lai Baru -baru ini, perpustakaan kode deteksi objek Yoloir baru telah dibuka, yang mengintegrasikan berbagai model Yolo, termasuk Yolov5, Yolov7, Yolor, Yolox, Yolov4, Yolov3 dan model Yolo lainnya, serta berbagai mekanisme perhatian yang ada.

ECCV2022 Ringkasan Kertas: ECCV2022-Paper-List

Memperluas