تنزيل siamese triplet - تنزيل رمز المصدر siamese triplet

siamese triplet

بايثون

1.0.0

تنزيل

التعلم السيامي والثلاثي مع تعدين عبر الإنترنت/ثلاثية

تنفيذ Pytorch للشبكات السيامية والشبكات الثلاثية للتعلم.

الشبكات السيامية والشبكات الثلاثي مفيدة لتعلم التعيينات من الصورة إلى مساحة إقليدية مدمجة حيث تتوافق المسافات مع مقياس التشابه [2]. يمكن استخدام التضمينات المدربة بهذه الطريقة كمتجهات ميزات للتصنيف أو مهام التعلم القليلة.

تثبيت

يتطلب pytorch 0.4 مع torchvision 0.2.1

ل Pytorch 0.3 التوافق الخروج tag torch-0.3.1

هيكل الكود

مجموعات البيانات
- فئة Siamesemnist - غلاف لمجموعة بيانات تشبه Mnist ، وإعادة أزواج إيجابية وسلبية عشوائية
- فئة Tripletmnist - غلاف لمجموعة بيانات تشبه Mnist ، وإرجاع ثلاثة توائم عشوائية (مرساة ، إيجابية وسلبية)
- فئة متوازنة BatchSampler - BatchSampler لعملية تحميل البيانات ، يختار بشكل عشوائي n_classes و n_samples من كل فئة استنادًا إلى الملصقات
الشبكات
- تضمين الشبكة الأساسية لترميز الصور في ناقل التضمين
- ClassificationNet - Wrapper لشبكة التضمين ، يضيف طبقة متصلة بالكامل وسجل SoftMax للتصنيف
- Siamesenet - غلاف لشبكة التضمين ، يعالج أزواج من المدخلات
- Tripletnet - غلاف لشبكة التضمين ، يعالج ثلاثة توائم من المدخلات
الخسارة
- Contraviveloss - خسارة متناقضة لأزواج التضمينات وهدف الزوج (نفس/مختلف)
- Tripletloss - خسارة ثلاثية لثلاثي التضمينات
- onlinecontrastiveloss - خسارة متناقضة لمجموعة صغيرة من التضمينات. يستخدم كائن Pairselector للعثور على أزواج إيجابية وسلبية داخل مزاحنة مصغرة باستخدام ملصقات فئة الحقيقة الأرضية ويحسب الخسارة المتناقضة لهذه الأزواج
- onlinetripletloss - خسارة ثلاثية لمجموعة صغيرة من التضمينات. يستخدم كائن Tripletselector للعثور على ثلاثة توائم داخل مجموعة مصغرة باستخدام ملصقات فئة الحقيقة الأرضية ويحسب الخسارة الثلاثية
المدرب
- Fit - وظيفة موحدة لتدريب شبكة ذات عدد مختلف من المدخلات وأنواع مختلفة من وظائف الخسارة
مقاييس
- عينة من المقاييس التي يمكن استخدامها مع وظيفة الملاءمة من Trainer.py
utils.py
- Pairselector - فئة مجردة تحديد الكائنات التي تولد أزواج بناءً على التضمينات وعلامات فئة الحقيقة الأرضية. يمكن استخدامها مع onlinecontrastiveloss .
  - allpositivePairselector ، HardNegativePairselector - تطبيقات pairselector
- Tripletselector - فئة مجردة تحديد الكائنات التي تولد ثلاثة توائم على أساس التضمينات وعلامات فئة الحقيقة الأرضية. يمكن استخدامها مع onlinetripletloss .
  - Alltripletselector ، HardestNegativetripletselector ، RandomNegativetripletselector ، semihardnegativetripletselector - تطبيقات Tripletselector

أمثلة - mnist

سنقوم بتدريب التضمينات على مجموعة بيانات MNIST. تم إجراء تجارب في دفتر Jupyter.

سنذهب من خلال التعلم التضمينات الخاضعة للإشراف باستخدام وظائف خسارة مختلفة على مجموعة بيانات MNIST. هذا فقط لأغراض التصور ، وبالتالي سنستخدم التضمينات ثنائية الأبعاد التي ليست الخيار الأفضل في الممارسة.

لكل تجربة يتم استخدام شبكة التضمين نفسها (32 Conv 5x5 -> Prelu -> MaxPool 2x2 -> 64 Conv 5x5 -> Prelu -> Maxpool 2x2 -> كثيف 256 -> Prelu -> كثيف 256 -> Prelu -> الكثافة 2) ونحن لا نجري أي عملية بحث هائلة.

خط الأساس - التصنيف مع softmax

نضيف طبقة متصلة بالكامل مع عدد الفئات وتدريب الشبكة للتصنيف باستخدام softmax و enropy. تتدرب الشبكة إلى دقة 99 ٪ تقريبًا. نستخرج ثنائي الأبعاد من الطبقة قبل الأخيرة:

مجموعة القطار:

مجموعة الاختبار:

على الرغم من أن التضمينات تبدو قابلة للفصل (وهو ما قمنا بتدريبه عليها) ، إلا أنه ليس لديهم خصائص مترية جيدة. قد لا تكون الخيار الأفضل كواصف لفصول جديدة.

شبكة سيامي

الآن سنقوم بتدريب شبكة Siamese التي تلتقط زوجًا من الصور وتدرب على التضمين بحيث يتم تقليل المسافة بينهما إذا كانت من نفس الفصل وهي أكبر من بعض قيمة الهامش إذا كانت تمثل فئات مختلفة. سنقلل من وظيفة فقدان التباين [1]:

Siamesemnist فئة العينات عشوائيا أزواج إيجابية وسلبية يتم تغذيتها بعد ذلك إلى شبكة سيامي.

بعد 20 عصرًا من التدريب ، هنا هي التضمينات التي نحصل عليها لمجموعة التدريب:

مجموعة الاختبار:

يتم تجميع التضمينات المستفادة بشكل أفضل بكثير داخل الفصل.

شبكة ثلاثية

سنقوم بتدريب شبكة ثلاثية ، والتي تأخذ مرساة ، ومرساة إيجابية (من نفس الفئة مثل مرساة) وسلبية (من فئة مختلفة عن المرساة). الهدف من ذلك هو تعلم التضمينات بحيث يكون المرساة أقرب إلى المثال الإيجابي مما هو عليه على المثال السلبي من خلال بعض قيمة الهامش.

alt text المصدر: شروف ، فلوريان ، ديمتري كالينيتشينكو ، وجيمس فيلبين. FaceNet: تضمين موحد للتعرف على الوجه والتجميع. CVPR 2015.

خسارة ثلاثية :

TripletMnist فئة عينات مثال إيجابي وسلبي لكل مرساة ممكنة.

بعد 20 عصرًا من التدريب ، هنا هي التضمينات التي نحصل عليها لمجموعة التدريب:

مجموعة الاختبار:

إن التضمينات المستفادة ليست قريبة من بعضها البعض داخل الفصل كما في حالة شبكة سيامي ، ولكن هذا ليس ما قمنا بتحسينه من أجله. أردنا أن تكون التضمينات أقرب إلى التضمينات الأخرى من نفس الفصل من الفصول الأخرى ويمكننا أن نرى ذلك هو المكان الذي سيذهب إليه التدريب.

اختيار الزوج/التوائم عبر الإنترنت - التعدين السلبي

هناك بعض المشاكل مع الشبكات السيامية والشبكات الثلاثية:

ينمو عدد الأزواج/الثلاثيات المحتملة من الناحية الترابطية/مكعب مع عدد الأمثلة. من غير الممكن معالجتها جميعًا ويتقارب التدريب ببطء.
نولد أزواج/ثلاثة توائم بشكل عشوائي . مع استمرار التدريب ، من السهل التعامل مع المزيد والمزيد من الأزواج/التوائم (قيمة الخسارة الصغيرة جدًا أو حتى 0) ، مما يمنع الشبكة من التدريب . نحن بحاجة إلى تزويد الشبكة بأمثلة صعبة .
يتم استخدام كل صورة يتم تغذيتها للشبكة فقط لحساب الخسارة المتناقضة/الثلاثي لزوج واحد/ثلاثة أضعاف فقط. الحساب يضيع إلى حد ما. بمجرد حساب التضمين ، يمكن إعادة استخدامه للعديد من الأزواج/الثلاثي.

للتعامل مع هذه المشكلات بكفاءة ، سنقوم بتغذية شبكة بمزارع مصغرة قياسية كما فعلنا للتصنيف. ستكون وظيفة الخسارة مسؤولة عن اختيار الأزواج الصلبة والثلاثي داخل الدفعة الصغيرة. إذا قمنا بتغذية الشبكة بـ 16 صورة لكل 10 فئات ، فيمكننا معالجة ما يصل إلى 159*160/2 = 12720 زوجًا و 10*16*15/2*(9*16) = 172800 ثلاث توابل ، مقارنة بـ 80 زوجًا و 53 ثلاثة توائم في التنفيذ السابق.

عادةً ما تكون أفضل فكرة لمعالجة جميع الأزواج أو الثلاثيات الممكنة داخل دفعة صغيرة. يمكننا العثور على بعض الاستراتيجيات حول كيفية اختيار ثلاثة توائم في [2] و [3].

اختيار الزوج عبر الإنترنت

سنقوم بتغذية شبكة مع مزارع صغيرة ، كما فعلنا لشبكة التصنيف. هذه المرة سنستخدم دفعة خاصة من سيقوم بتجربة n_classes و n_samples داخل كل فئة ، مما يؤدي إلى دفعات صغيرة من حجم n_classes*n_samples .

لكل دفعة صغيرة سيتم اختيار أزواج إيجابية وسلبية باستخدام ملصقات متوفرة.

MNIST هي مجموعة بيانات سهلة إلى حد ما ، وكانت التضمينات من الأزواج التي تم اختيارها عشوائيًا جيدًا بالفعل ، ولا نرى الكثير من التحسن هنا.

التضمينات القطار:

اختبار التضمينات:

اختيار الثلاثي عبر الإنترنت

سنقوم بتغذية شبكة مع مكامن صغيرة مثل اختيار الزوج عبر الإنترنت. هناك اثنين من الاستراتيجيات التي يمكننا استخدامها للاختيار الثلاثي المعطى الملصقات والتضمينات المتوقعة:

كل التوائم الممكنة (قد تكون أكثر من اللازم)
أصعب سلبية لكل زوج إيجابي (سوف يؤدي إلى نفس السلبية لكل مرساة)
سلبي صلب عشوائي لكل زوج إيجابي (ضع في اعتبارك ثلاثة توائم مع قيمة فقدان ثلاثية إيجابية)
سالب شبه سلبي لكل زوج إيجابي (على غرار [2])

يجب اختيار استراتيجية الاختيار الثلاثي بعناية. قد تؤدي الإستراتيجية السيئة إلى تدريب غير فعال أو ، والأسوأ من ذلك ، أن تنهار (جميع التضمينات التي تنتهي بها نفس القيم).

إليك ما حصلنا عليه مع سلبيات صعبة عشوائية لكل زوج إيجابي.

مجموعة التدريب:

مجموعة الاختبار:

الموضة

أجريت تجارب مماثلة لمجموعة بيانات الموضة حيث تكون مزايا التعدين السلبي عبر الإنترنت أكثر وضوحًا قليلاً. تم استخدام نفس بنية الشبكة بالضبط مع تضمينات ثنائية الأبعاد فقط ، والتي ربما لا تكون معقدة بما يكفي لتعلم التضمينات الجيدة. يجب أن تستفيد مجموعات البيانات الأكثر تعقيدًا ذات فصول العدد الأعداد أكثر من التعدين عبر الإنترنت.

خط الأساس - التصنيف

سيامي مقابل الخسارة عبر الإنترنت مع التعدين السلبي

شبكة سيامي مع أزواج مختارة عشوائيا

خسارة متناقضة عبر الإنترنت مع التعدين السلبي

Triplet مقابل الخسارة الثلاثية عبر الإنترنت مع التعدين السلبي

شبكة ثلاثية مع ثلاثة توائم عشوائية

خسارة ثلاثية عبر الإنترنت مع التعدين السلبي

تودو

تحسين الاختيار الثلاثي
تقييم مع مقياس قابلي للمقارنة بين الأساليب
التقييم في إعداد طلقة واحدة عندما تكون الفصول من مجموعة الاختبار ليست في مجموعة القطار
عرض مثال اختيار ثلاثي عبر الإنترنت على مجموعات البيانات الأكثر صعوبة

مراجع

[1] Raia Hadsell ، Sumit Chopra ، Yann Lecun ، الحد من الأبعاد عن طريق تعلم رسم الخرائط الثابت ، CVPR 2006

[2] شروف ، فلوريان ، ديمتري كالينيتشينكو ، وجيمس فيلبين. FaceNet: تضمين موحد للتعرف على الوجه والتجميع. CVPR 2015

[3] ألكساندر هيرمانز ، لوكاس باير ، باستيان ليبي ، دفاعًا عن الخسارة الثلاثية لإعادة تحديد الشخص ، 2017

[4] براندون آموس ، بارتوز لودويتشوك ، ماهاديف ساتيانارايانان ، Openface: مكتبة التعرف على الوجه للأغراض العامة مع تطبيقات الهاتف المحمول ، 2016

[5] يي صن ، Xiaogang Wang ، Xiaouou Tang ، تمثيل وجه التعلم العميق عن طريق تحديد هوية المفصل ، NIPS 2014

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع بايثون
وقت التحديث 2025-07-11
الحجم 4.04MB
من Github

تطبيقات ذات صلة

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
ToDo Co

بايثون

1.0.0
Python Portfolio

بايثون
Redash أداة مخطط البيانات مفتوحة المصدر v24.10.0

بايثون

24.10.0
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل