efficient_densenet_pytorch تنزيل - efficient_densenet_pytorch تنزيل رمز المصدر

efficient_densenet_pytorch

بايثون

1.0.0

تنزيل

effain_densenet_pytorch

Pytorch> = 1.0 تنفيذ الكثافة ، تم تحسينه لحفظ ذاكرة GPU.

التحديثات الأخيرة

يعمل الآن على Pytorch 1.0! ويستخدم ميزة checkpointing ، مما يجعل هذا الرمز أكثر كفاءة !!!

تحفيز

في حين أن الكثافة سهلة التنفيذ إلى حد ما في أطر التعلم العميق ، فإن معظم عمليات التنفس (مثل الأصل) تميل إلى أن تكون متعطشة للذاكرة. على وجه الخصوص ، ينمو عدد خرائط الميزات الوسيطة الناتجة عن تطبيع الدُفعات وعمليات التسلسل التربيعية مع عمق الشبكة. تجدر الإشارة إلى أن هذه ليست خاصية متأصلة في الكثافة ، بل للتنفيذ.

يستخدم هذا التنفيذ استراتيجية جديدة لتقليل استهلاك ذاكرة الكثافة. نحن نستخدم CheckPointing لحساب خرائط المعيار الدُفعات وميزات التسلسل. يتم التخلص من خرائط الميزات الوسيطة هذه أثناء التمريرة الأمامية وإعادة حسابها للمرور للخلف. هذا يضيف 15-20 ٪ من الوقت النفقات العامة للتدريب ، ولكنه يقلل من استهلاك خريطة الميزات من التربيع إلى الخطي.

هذا التنفيذ مستوحى من هذا التقرير الفني ، الذي يوضح استراتيجية للكائنات الفعالة من خلال مشاركة الذاكرة.

متطلبات

Pytorch> = 1.0.0
كودا

الاستخدام

في مشروعك الحالي: يوجد ملف واحد في مجلد models .

models/densenet.py هي تطبيق يستند إلى تطبيقات TorchVision و Project Killer.

إذا كنت تهتم بالسرعة ، والذاكرة ليست خيارًا ، فقم بتمرير الوسيطة efficient=False في مُنشئ DenseNet . خلاف ذلك ، تمر في efficient=True .

خيارات:

يتم وصف جميع الخيارات في مستندات ملفات النموذج
يتم التحكم في العمق بواسطة خيار block_config
efficient=True يستخدم إصدار الذاكرة الموفرة للذاكرة
إذا كنت ترغب في استخدام النموذج لـ ImageNet ، فقم بتعيين small_inputs=False . ل cifar أو svhn ، تعيين small_inputs=True .

تشغيل العرض التوضيحي:

الحزمة الإضافية الوحيدة التي تحتاج إلى تثبيتها هي Python-Fire:

pip install fire

GPU واحد:

CUDA_VISIBLE_DEVICES=0 python demo.py --efficient True --data < path_to_folder_with_cifar 10> --save < path_to_save_dir >

GPU متعددة:

CUDA_VISIBLE_DEVICES=0,1,2 python demo.py --efficient True --data < path_to_folder_with_cifar 10> --save < path_to_save_dir >

خيارات:

--depth (int) -عمق الشبكة (عدد طبقات الالتواء) (الافتراضي 40)
--growth_rate (int) -عدد الميزات المضافة لكل طبقة Densenet (افتراضي 12)
--n_epochs (int) -عدد الحقبة للتدريب (الافتراضي 300)
--batch_size (int) -حجم minibatch (افتراضي 256)
--seed (int) -قم بتعيين البذور العشوائية يدويًا (لا شيء افتراضي)

أداء

مقارنة بين التنفيذ (كل منهما عبارة عن Densenet-BC مع 100 طبقة ، حجم الدفعة 64 ، تم اختبارها على Nvidia Pascal Titan-X):

تطبيق	إزاحة الذاكرة (GB/GPU)	السرعة (Sec/Mini Batch)
ساذج	2.863	0.165
فعال	1.605	0.207
فعال (متعدد GPU)	0.985	-

تطبيقات فعالة أخرى

Luatorch (بواسطة Gao Huang)
TensorFlow (بواسطة Joe Yearsley)
الكافيين (بقلم تونغشنغ لي)

مرجع

 @article{pleiss2017memory,
  title={Memory-Efficient Implementation of DenseNets},
  author={Pleiss, Geoff and Chen, Danlu and Huang, Gao and Li, Tongcheng and van der Maaten, Laurens and Weinberger, Kilian Q},
  journal={arXiv preprint arXiv:1707.06990},
  year={2017}
}

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع بايثون
وقت التحديث 2025-07-15
الحجم 1.02MB
من Github

تطبيقات ذات صلة

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
محرك تحليل البيانات Lihua الإصدار المجاني 3.0_search_navigation_collection_public Oplic_ranking_api

2022-06-28

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ToDo Co

بايثون

1.0.0
Python Portfolio

بايثون
datamule python

بايثون
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل