تنزيل FlowNetPytorch - تنزيل رمز FlowNetPytorch

FlowNetPytorch

بايثون

1.0.0

تنزيل

Flownetpytorch

تنفيذ Pytorch من Flownet بواسطة Dosovitskiy et al.

هذا المستودع هو تنفيذ شعلة لـ Flownet ، بقلم Alexey Dosovitskiy et al. في Pytorch. انظر تطبيق الشعلة هنا

هذا الرمز مستوحى بشكل أساسي من مثال ImageNet الرسمي. لم يتم اختباره لعمود معالجة الرسومات المتعددة ، ولكن يجب أن يعمل كما هو الحال في الكود الأصلي.

يوفر الرمز مثالًا تدريبيًا ، باستخدام مجموعة بيانات الكراسي الطيران ، مع زيادة البيانات. يمكن إضافة تطبيق لمجموعات بيانات تدفق المشهد في المستقبل.

يتم توفير نموذجين للشبكة العصبية حاليًا ، إلى جانب تباين المعيار الدُفعات (التجريبي):

الطيران
Flownetsbn
Flownetc
FLOWNETCBN

نماذج ما قبل

بفضل kaixhin ، يمكنك تنزيل نسخة مسبقة من Flownets (من Caffe ، وليس من Pytorch) هنا. يحتوي هذا المجلد أيضًا على شبكات مدربة من الصفر.

ملاحظة على تحميل الشبكات

قم بتغذية الشبكة التي تم تنزيلها مباشرةً إلى البرنامج النصي ، لا تحتاج إلى إلغاء ضغطها حتى لو أخبرك بيئة سطح المكتب بذلك.

ملاحظة على الشبكات من الكافيين

تتوقع هذه الشبكات إدخال BGR (مقارنة بـ RGB في Pytorch). ومع ذلك ، فإن ترتيب BGR ليس مهمًا جدًا.

المتطلب السابق

يمكن تثبيت هذه الوحدات مع pip

 pytorch >= 1.2
tensorboard-pytorch
tensorboardX >= 1.4
spatial-correlation-sampler>=0.2.1
imageio
argparse
path.py

أو

pip install -r requirements.txt

التدريب على مجموعة بيانات الكراسي الطيران

أولاً ، تحتاج إلى تنزيل مجموعة بيانات Flying Chair. إنه كبير ~ 64 جيجابايت ونوصيك بوضعه في محرك SSD.

إن فرط المسماعات الافتراضية المتوفرة في main.py هي نفسها كما في البرامج النصية للتدريب على الكافيين.

مثال على الاستخدام لـ Flownets:

python main.py /path/to/flying_chairs/ -b8 -j8 -a flownets

نوصيك بتعيين J (عدد مؤشرات ترابط البيانات) على ارتفاع إذا كنت تستخدم DataAugmentation لتجنب تحميل البيانات لإبطاء التدريب.

لمزيد من المساعدة يمكنك الكتابة

python main.py -h

تصور التدريب

يتم استخدام Tensorboard-Pytorch للتسجيل. لتصور النتيجة ، ببساطة اكتب

tensorboard --logdir=/path/to/checkpoints

نتائج التدريب

يمكن تنزيل النماذج هنا في مجلد Pytorch.

تم تدريب النماذج مع خيارات افتراضية ما لم يتم تحديدها. لم يتم استخدام تزييف اللون.

قوس	معدل التعلم	حجم الدُفعة	حجم الحقبة	اسم الملف	التحقق من الصحة EPE
الطيران	1E-4	8	2700	Flownets_epe1.951.pth.tar	1.951
نطاقات bn	1E-3	32	695	Flownets_BN_EPE2.459.PTH.TAR	2.459
Flownetc	1E-4	8	2700	flownetc_epe1.766.pth.tar	1.766

ملاحظة : استغرق Flownets BN وقتًا أطول للتدريب وحصلت على نتائج أسوأ. يُنصح بشدة بعدم استخدامه لمجموعة بيانات الكراسي الطيران.

عينات التحقق من الصحة

يتم التنبؤ بواسطة الطول.

رمز دقيق للتدفق البصري -> يمكن العثور على خريطة اللون هنا

مدخل	تنبؤ	جروح

تشغيل الاستدلال على مجموعة من أزواج الصور

إذا كنت بحاجة إلى تشغيل الشبكة على صورك ، فيمكنك تنزيل شبكة مسبقة هنا وتشغيل البرنامج النصي للاستدلال على مجلد أزواج الصور.

يحتاج المجلد الخاص بك إلى الحصول على جميع أزواج الصور في نفس الموقع ، مع نمط الاسم

 {image_name}1.{ext}
{image_name}2.{ext}

python3 run_inference.py /path/to/images/folder /path/to/pretrained

بالنسبة إلى البرنامج النصي main.py ، تتوفر قائمة مساعدة لخيارات إضافية.

ملاحظة على وظائف التحويل

من أجل الحصول على تحولات متماسكة بين المدخلات والهدف ، يجب أن نحدد التحولات الجديدة التي تأخذ كل من الإدخال والهدف ، حيث يتم تعريف متغير عشوائي جديد في كل مرة يتم فيها استدعاء تحول عشوائي.

تحولات التدفق

للسماح بزيادة البيانات ، فكرنا في الدوران والترجمات للمدخلات ونتائجها على خريطة التدفق المستهدف. فيما يلي مجموعة من الأشياء لرعايتها من أجل تحقيق زيادة مناسبة للبيانات

ترتبط خريطة التدفق مباشرة بـ IMG1

إذا قمت بتطبيق تحول على IMG1 ، فيجب عليك تطبيق نفس خريطة التدفق ، للحصول على نقاط أصل متماسكة للتدفق.

الترجمة بين IMG1 و IMG2

بالنظر إلى ترجمة (tx,ty) المطبقة على IMG2 ، سيكون لدينا

 flow[:,:,0] += tx
flow[:,:,1] += ty

حجم

مقياس يتم تطبيقه على كل من IMG1 و IMG2 مع معلمات التكبير alpha يضاعف التدفق بنفس الكمية

 flow *= alpha

تم تطبيق الدوران على كلتا الصورتين

دوران يتم تطبيقه على كلتا الصورتين بواسطة زاوية theta يدور أيضًا متجهات التدفق ( flow[i,j] ) بواسطة نفس الزاوية

 for_all i,j flow[i,j] = rotate(flow[i,j], theta)

rotate: x,y,theta ->  (x*cos(theta)-x*sin(theta), y*cos(theta), x*sin(theta))

يتم تطبيق الدوران على IMG2

دعونا نفكر في دوران من زاوية theta من مركز الصور.

يجب أن نتحرك كل ناقل تدفق بناءً على الإحداثيات التي تهبط فيها. في كل إحداثي (i, j) ، لدينا:

 flow[i, j, 0] += (cos(theta) - 1) * (j  - w/2 + flow[i, j, 0]) +    sin(theta)    * (i - h/2 + flow[i, j, 1])
flow[i, j, 1] +=   -sin(theta)    * (j  - w/2 + flow[i, j, 0]) + (cos(theta) - 1) * (i - h/2 + flow[i, j, 1])

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع بايثون
وقت التحديث 2025-07-12
الحجم 1.1MB
من Github

تطبيقات ذات صلة

ToDo Co

2025-03-22
Python Portfolio

2024-11-10
Redash أداة مخطط البيانات مفتوحة المصدر v24.10.0

2024-11-27
datamule python

2024-11-08
منصة تصور البيانات SmartChart v6.9

2024-11-27
أداة اختبار حمل الجراد v2.32.0

2024-11-27

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ToDo Co

بايثون

1.0.0
Python Portfolio

بايثون
Redash أداة مخطط البيانات مفتوحة المصدر v24.10.0

بايثون

24.10.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل