efficient_densenet_pytorch ดาวน์โหลด - efficient_densenet_pytorch ซอร์สโค้ดดาวน์โหลดดาวน์โหลด

efficient_densenet_pytorch

หลาม

1.0.0

ดาวน์โหลด

efficient_densenet_pytorch

pytorch> = 1.0 การใช้งาน densenets, ปรับให้เหมาะสมเพื่อบันทึกหน่วยความจำ GPU

อัปเดตล่าสุด

ตอนนี้ใช้งานได้กับ Pytorch 1.0! ใช้คุณสมบัติการตรวจสอบซึ่งทำให้รหัสนี้มีประสิทธิภาพมากขึ้น !!!

แรงจูงใจ

ในขณะที่ Densenets นั้นค่อนข้างง่ายที่จะนำไปใช้ในกรอบการเรียนรู้ลึก แต่การสร้างส่วนใหญ่ (เช่นต้นฉบับ) มีแนวโน้มที่จะหิวโหย โดยเฉพาะอย่างยิ่งจำนวนแผนที่คุณลักษณะระดับกลางที่สร้างขึ้นโดยการทำให้เป็นมาตรฐานและการดำเนินการต่อการเชื่อมต่อจะเพิ่มขึ้นเป็นสองเท่าด้วยความลึกของเครือข่าย มันคุ้มค่าที่จะเน้นว่านี่ไม่ใช่ทรัพย์สินที่มีอยู่ใน densenets แต่เป็นการดำเนินการ

การใช้งานนี้ใช้กลยุทธ์ใหม่เพื่อลดการใช้หน่วยความจำของ Densenets เราใช้จุดตรวจสอบเพื่อคำนวณบรรทัดฐานแบทช์และแผนที่คุณสมบัติการต่อกัน แผนที่คุณลักษณะระดับกลางเหล่านี้จะถูกยกเลิกในระหว่างการส่งไปข้างหน้าและคำนวณใหม่สำหรับผ่านไปข้างหลัง สิ่งนี้จะเพิ่มค่าใช้จ่าย 15-20% สำหรับการฝึกอบรม แต่ ลดการใช้แผนที่คุณลักษณะจากกำลังสองเป็นเชิงเส้น

การใช้งานนี้ได้รับแรงบันดาลใจจากรายงานทางเทคนิคนี้ซึ่งสรุปกลยุทธ์สำหรับ Densenets ที่มีประสิทธิภาพผ่านการแชร์หน่วยความจำ

ความต้องการ

pytorch> = 1.0.0
คนขี้เกียจ

การใช้งาน

ในโครงการที่มีอยู่ของคุณ: มีหนึ่งไฟล์ในโฟลเดอร์ models

models/densenet.py เป็นการนำไปใช้งานตามการใช้งาน Torchvision และ Project Killer

หากคุณใส่ใจเกี่ยวกับความเร็วและหน่วยความจำไม่ใช่ตัวเลือกให้ผ่านอาร์กิวเมนต์ efficient=False ลงในตัวสร้าง DenseNet มิฉะนั้นให้ส่งผ่าน efficient=True

ตัวเลือก:

ตัวเลือกทั้งหมดอธิบายไว้ในเอกสารของไฟล์โมเดล
ความลึกถูกควบคุมโดยตัวเลือก block_config
efficient=True ใช้เวอร์ชันที่มีประสิทธิภาพหน่วยความจำ
หากคุณต้องการใช้โมเดลสำหรับ ImageNet ให้ตั้งค่า small_inputs=False สำหรับ CIFAR หรือ SVHN ให้ตั้งค่า small_inputs=True

เรียกใช้การสาธิต:

แพ็คเกจพิเศษเพียงอย่างเดียวที่คุณต้องติดตั้งคือ Python-Fire:

pip install fire

GPU เดี่ยว:

CUDA_VISIBLE_DEVICES=0 python demo.py --efficient True --data < path_to_folder_with_cifar 10> --save < path_to_save_dir >

GPU หลายตัว:

CUDA_VISIBLE_DEVICES=0,1,2 python demo.py --efficient True --data < path_to_folder_with_cifar 10> --save < path_to_save_dir >

ตัวเลือก:

--depth (int) -ความลึกของเครือข่าย (จำนวนเลเยอร์ convolution) (ค่าเริ่มต้น 40)
--growth_rate (int) -จำนวนคุณสมบัติที่เพิ่มต่อเลเยอร์ densenet (ค่าเริ่มต้น 12)
--n_epochs (int) -จำนวนยุคสำหรับการฝึกอบรม (ค่าเริ่มต้น 300)
--batch_size (int) -ขนาดของ minibatch (ค่าเริ่มต้น 256)
--seed (int) -ตั้งค่าเมล็ดสุ่มด้วยตนเอง (ไม่มีค่าเริ่มต้น)

ผลงาน

การเปรียบเทียบการใช้งานทั้งสอง (แต่ละรายการเป็น densenet-BC ที่มี 100 ชั้นขนาดแบทช์ 64 ทดสอบบน Nvidia Pascal Titan-X):

การดำเนินการ	หน่วยความจำไอออน (GB/GPU)	ความเร็ว (Sec/Mini Batch)
ไร้เดียงสา	2.863	0.165
มีประสิทธิภาพ	1.605	0.207
มีประสิทธิภาพ (Multi-GPU)	0.985	-

การใช้งานที่มีประสิทธิภาพอื่น ๆ

Luatorch (โดย Gao Huang)
Tensorflow (โดย Joe Yearsley)
คาเฟอีน (โดย Tongcheng Li)

อ้างอิง

 @article{pleiss2017memory,
  title={Memory-Efficient Implementation of DenseNets},
  author={Pleiss, Geoff and Chen, Danlu and Huang, Gao and Li, Tongcheng and van der Maaten, Laurens and Weinberger, Kilian Q},
  journal={arXiv preprint arXiv:1707.06990},
  year={2017}
}

ขยาย

ข้อมูลเพิ่มเติม

เวอร์ชัน 1.0.0
ประเภท หลาม
เวลาอัปเดต 2025-07-15
ขนาด 1.02MB
มาจาก Github

แอปที่เกี่ยวข้อง

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
เครื่องมือวิเคราะห์ข้อมูล Lihua เวอร์ชันฟรี 3.0_search_navigation_collection_public comment_ranking_api

2022-06-28

แนะนำสำหรับคุณ

chat.petals.dev

ซอร์สโค้ดอื่น ๆ

1.0.0
GPT Prompt Templates

ซอร์สโค้ดอื่น ๆ

1.0.0
GPTyped

ซอร์สโค้ดอื่น ๆ

GPTyped 1.0.5
ToDo Co

หลาม

1.0.0
Python Portfolio

หลาม
datamule python

หลาม
Google Dorks

ซอร์สโค้ดอื่น ๆ

1.0
shepherd

ซอร์สโค้ดอื่น ๆ

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

ซอร์สโค้ดอื่น ๆ

v1.1.0-rc-3

ข้อมูลที่เกี่ยวข้อง ทั้งหมด