Pytorch Memory Utils ดาวน์โหลด - Pytorch Memory Utils Source Source Download

Pytorch Memory Utils

หลาม

1.0.0

ดาวน์โหลด

Pytorch-memory-utils

รหัสเหล่านี้สามารถช่วยคุณตรวจจับหน่วยความจำ GPU ของคุณในระหว่างการฝึกด้วย pytorch

บล็อกเกี่ยวกับเครื่องมือนี้และอธิบายรายละเอียด: https://oldpan.me/archives/pytorch-gpu-memory-usage-track

การใช้งาน:

ใส่ modelsize_estimate.py หรือ gpu_mem_track.py ภายใต้ไดเรกทอรีการทำงานปัจจุบันของคุณและนำเข้า

ต่อไปนี้เป็นเนื้อหาการพิมพ์

คำนวณการใช้หน่วยความจำของรุ่นเดียว

 Model Sequential : params: 0.450304M
Model Sequential : intermedite variables: 336.089600 M (without backward)
Model Sequential : intermedite variables: 672.179200 M (with backward)

ติดตามจำนวนการใช้หน่วยความจำ GPU

 # 30-Apr-21-20:25:29-gpu_mem_track.txt

GPU Memory Track | 30-Apr-21-20:25:29 | Total Tensor Used Memory:0.0    Mb Total Used Memory:0.0    Mb


At main.py line 10: < module >                          Total Tensor Used Memory:0.0    Mb Total Allocated Memory:0.0    Mb

+ | 1 * Size:(64, 64, 3, 3)       | Memory: 0.1406 M | <class 'torch.nn.parameter.Parameter'> | torch.float32
+ | 1 * Size:(128, 128, 3, 3)     | Memory: 0.5625 M | <class 'torch.nn.parameter.Parameter'> | torch.float32
+ | 1 * Size:(256, 128, 3, 3)     | Memory: 1.125 M | <class 'torch.nn.parameter.Parameter'> | torch.float32
+ | 1 * Size:(512, 256, 3, 3)     | Memory: 4.5 M | <class 'torch.nn.parameter.Parameter'> | torch.float32
+ | 3 * Size:(256, 256, 3, 3)     | Memory: 6.75 M | <class 'torch.nn.parameter.Parameter'> | torch.float32
+ | 8 * Size:(512,)               | Memory: 0.0156 M | <class 'torch.nn.parameter.Parameter'> | torch.float32
+ | 2 * Size:(64,)                | Memory: 0.0004 M | <class 'torch.nn.parameter.Parameter'> | torch.float32
+ | 7 * Size:(512, 512, 3, 3)     | Memory: 63.0 M | <class 'torch.nn.parameter.Parameter'> | torch.float32
+ | 4 * Size:(256,)               | Memory: 0.0039 M | <class 'torch.nn.parameter.Parameter'> | torch.float32
+ | 1 * Size:(128, 64, 3, 3)      | Memory: 0.2812 M | <class 'torch.nn.parameter.Parameter'> | torch.float32
+ | 2 * Size:(128,)               | Memory: 0.0009 M | <class 'torch.nn.parameter.Parameter'> | torch.float32
+ | 1 * Size:(64, 3, 3, 3)        | Memory: 0.0065 M | <class 'torch.nn.parameter.Parameter'> | torch.float32

At main.py line 12: < module >                          Total Tensor Used Memory:76.4   Mb Total Allocated Memory:76.4   Mb

+ | 1 * Size:(60, 3, 512, 512)    | Memory: 180.0 M | <class 'torch.Tensor'> | torch.float32
+ | 1 * Size:(40, 3, 512, 512)    | Memory: 120.0 M | <class 'torch.Tensor'> | torch.float32
+ | 1 * Size:(30, 3, 512, 512)    | Memory: 90.0 M | <class 'torch.Tensor'> | torch.float32

At main.py line 18: < module >                          Total Tensor Used Memory:466.4  Mb Total Allocated Memory:466.4  Mb

+ | 1 * Size:(120, 3, 512, 512)   | Memory: 360.0 M | <class 'torch.Tensor'> | torch.float32
+ | 1 * Size:(80, 3, 512, 512)    | Memory: 240.0 M | <class 'torch.Tensor'> | torch.float32

At main.py line 23: < module >                          Total Tensor Used Memory:1066.4 Mb Total Allocated Memory:1066.4 Mb

- | 1 * Size:(40, 3, 512, 512)    | Memory: 120.0 M | <class 'torch.Tensor'> | torch.float32
- | 1 * Size:(120, 3, 512, 512)   | Memory: 360.0 M | <class 'torch.Tensor'> | torch.float32

At main.py line 29: < module >                          Total Tensor Used Memory:586.4  Mb Total Allocated Memory:586.4  Mb

วิธีใช้

ติดตามจำนวนการใช้หน่วยความจำ GPU

ตัวอย่างง่ายๆ:

 import torch

from torchvision import models
from gpu_mem_track import MemTracker

device = torch . device ( 'cuda:0' )

gpu_tracker = MemTracker ()         # define a GPU tracker

gpu_tracker . track ()                     # run function between the code line where uses GPU
cnn = models . vgg19 ( pretrained = True ). features . to ( device ). eval ()
gpu_tracker . track ()                     # run function between the code line where uses GPU

dummy_tensor_1 = torch . randn ( 30 , 3 , 512 , 512 ). float (). to ( device )  # 30*3*512*512*4/1024/1024 = 90.00M
dummy_tensor_2 = torch . randn ( 40 , 3 , 512 , 512 ). float (). to ( device )  # 40*3*512*512*4/1024/1024 = 120.00M
dummy_tensor_3 = torch . randn ( 60 , 3 , 512 , 512 ). float (). to ( device )  # 60*3*512*512*4/1024/1024 = 180.00M

gpu_tracker . track ()

dummy_tensor_4 = torch . randn ( 120 , 3 , 512 , 512 ). float (). to ( device )  # 120*3*512*512*4/1024/1024 = 360.00M
dummy_tensor_5 = torch . randn ( 80 , 3 , 512 , 512 ). float (). to ( device )  # 80*3*512*512*4/1024/1024 = 240.00M

gpu_tracker . track ()

dummy_tensor_4 = dummy_tensor_4 . cpu ()
dummy_tensor_2 = dummy_tensor_2 . cpu ()
gpu_tracker . clear_cache () # or torch.cuda.empty_cache()

gpu_tracker . track ()

สิ่งนี้จะส่งออก .txt ไปยัง DIR ปัจจุบันและเนื้อหาของเอาต์พุตอยู่ด้านบน (เนื้อหาพิมพ์)

คำถามที่พบบ่อย

เหตุใดหน่วยความจำที่ใช้เทนเซอร์ทั้งหมดจึงมีขนาดเล็กกว่าหน่วยความจำที่จัดสรรทั้งหมดมาก

หน่วยความจำที่จัดสรรทั้งหมดคือจุดสูงสุดของการใช้หน่วยความจำ เมื่อคุณลบเทนเซอร์บางส่วน Pytorch จะไม่ปล่อยพื้นที่ไปยังอุปกรณ์จนกว่าคุณจะเรียก gpu_tracker.clear_cache() เช่นสคริปต์ตัวอย่าง
เคอร์เนล Cuda จะใช้พื้นที่ ดู pytorch/pytorch#12873

เหตุใดหน่วยความจำที่จัดสรรทั้งหมดจึงไม่เปลี่ยนแปลง?

ดู Q1.

ฉันลบเทนเซอร์บางส่วน เหตุใดพวกเขาจึงไม่ถูกลบในเอาต์พุตของตัวติดตาม?

ตรวจสอบให้แน่ใจว่าคุณได้เปิดตัวการอ้างอิงทั้งหมดไปยังวัตถุเทนเซอร์ จากนั้นคุณสามารถเรียกว่า "นำเข้า GC; gc.collect ()" และบอก Python เพื่อรวบรวมเทนเซอร์ที่ไม่ได้รับการอ้างอิง