head_detector download - head_detector source code download

head_detector

شفرة المصدر الأخرى

1.0.0

تنزيل

VgGheads: مجموعة بيانات اصطناعية واسعة النطاق للرؤوس البشرية ثلاثية الأبعاد

Orest Kupyn ¹³ · Eugene Khvedchenia ² · Christian Rupprecht ¹ ·

¹ جامعة أكسفورد · ² الجامعة الكاثوليكية الأوكرانية · ³ Piñatafarms AI

VgGheads هي مجموعة بيانات اصطناعية على نطاق واسع للكشف عن الرأس البشري وتقدير شبكة ثلاثية الأبعاد مع أكثر من مليون صورة تم إنشاؤها مع نماذج الانتشار. يعتمد نموذج يتم تدريبه فقط على البيانات الاصطناعية بشكل جيد للعالم الحقيقي وقادر على اكتشاف الرؤوس المتزامنة وإعادة بناء الرأس من صورة واحدة في خطوة واحدة.

لافتة

أخبار

[2024/08/30] إصدار الإصدار 0.1.0. أمثلة إضافية لمحاذاة الرأس وتوفير الشبكات مثل .OBJ
[2024/08/29] نقوم بإصدار مجموعة البيانات وتعليمات التدريب والأوزان ONNX !!
[2024/08/09] نقوم بإطلاق نقطة تفتيش VGGHEADS_L و MESH CONTROLNET
[2024/07/26] نقوم بإصدار الإصدار الأولي من قاعدة الكود والورقة وصفحة الويب للمشروع وتوضيح صورة !!

تعليمات تنزيل مجموعة بيانات VGGHEADS

1. قم بتنزيل مجموعة البيانات

لتنزيل مجموعة بيانات VGGHeads ، لديك خياران:

تنزيل التورنت (الطريقة المفضلة): كيفية التنزيل

pip install academictorrents
at-get 1ac36f16386061685ed303dea6f0d6179d2e2121

أو استخدام ARIA2C

aria2c --seed-time=0 --max-overall-download-limit=10M --file-allocation=none https://academictorrents.com/download/1ac36f16386061685ed303dea6f0d6179d2e2121.torrent

رابط التورنت الكامل

نوصي باستخدام طريقة التورنت لأنها عادة ما تكون أسرع وتساعد على تقليل الحمل على خوادمنا.

التنزيل المباشر:

wget https://thor.robots.ox.ac.uk/vgg-heads/VGGHeads.tar

سيؤدي ذلك إلى تنزيل ملف اسمه VGGHeads.tar إلى دليلك الحالي.

2. قم بتنزيل MD5 Checksums

للتحقق من سلامة الملف الذي تم تنزيله ، سنحتاج إلى فحص MD5. قم بتنزيلها باستخدام:

wget https://thor.robots.ox.ac.uk/vgg-heads/MD5SUMS

3. تحقق من التنزيل

بعد تنزيل كلا الملفين ، تحقق من سلامة ملف VGGHeads.tar :

md5sum -c MD5SUMS

إذا كان التنزيل ناجحًا وكان الملف سليمًا ، فيجب أن ترى رسالة "موافق".

4. استخراج مجموعة البيانات

إذا كان التحقق ناجحًا ، فاستخرج محتويات ملف القطران:

tar -xvf VGGHeads.tar

سيؤدي ذلك إلى استخراج محتويات الأرشيف في الدليل الحالي.

ملحوظات:

يبلغ حجم مجموعة البيانات حوالي 187 جيجابايت. تأكد من أن لديك مساحة كافية للقرص قبل التنزيل والاستخراج.
قد تستغرق عملية التنزيل والاستخراج بعض الوقت اعتمادًا على اتصال الإنترنت وسرعة الكمبيوتر.
إذا واجهت أي مشكلات أثناء عملية التنزيل أو الاستخراج ، فحاول التنزيل مرة أخرى أو تحقق من الأداة المساعدة لنظامك.

تثبيت

إنشاء بيئة افتراضية كوندا

conda create --name vgg_heads python=3.10
conda activate vgg_heads

استنساخ المشروع وتثبيت الحزمة

git clone https://github.com/KupynOrest/head_detector.git
cd head_detector

pip install -e ./

أو ببساطة تثبيت

pip install git+https://github.com/KupynOrest/head_detector.git

الاستخدام

لاختبار نموذج VGGHeads على صورك الخاصة ، استخدم هذا الرمز: ما عليك سوى استخدام هذا الرمز:

 from head_detector import HeadDetector
import cv2
detector = HeadDetector ()
image_path = "your_image.jpg"
predictions = detector ( image_path )
# predictions.heads contain a list of heads with .bbox, .vertices_3d, .head_pose params
result_image = predictions . draw () # draw heads on the image
cv2 . imwrite ( "result.png" , result_image ) # save result image to preview it.

تصدير شبكات الرأس

يمكنك تصدير شبكات الرأس كملفات OBJ باستخدام طريقة save_meshes :

 # After getting predictions
save_folder = "path/to/save/folder"
predictions . save_meshes ( save_folder )

سيؤدي ذلك إلى حفظ ملفات OBJ الفردية لكل رأس مكتشف في المجلد المحدد.

الحصول على محاصيل الرأس المحاذاة

للحصول على محاصيل الرأس المحاذاة ، استخدم طريقة get_aligned_heads :

 # After getting predictions
aligned_heads = predictions . get_aligned_heads ()

# Process or save aligned head crops
for i , head in enumerate ( aligned_heads ):
    cv2 . imwrite ( f"aligned_head_ { i } .png" , head )

هذا يعيد قائمة محاصيل الرأس المحاذاة التي يمكنك معالجة أو حفظها.

مثال ممتد

إليك مثال كامل يتضمن جميع الميزات:

 from head_detector import HeadDetector
import cv2
import os

# Initialize the detector
detector = HeadDetector ()

# Specify the path to your image
image_path = "your_image.jpg"

# Get predictions
predictions = detector ( image_path )

# Draw heads on the image
result_image = predictions . draw ()
cv2 . imwrite ( "result.png" , result_image )

# Save head meshes
save_folder = "head_meshes"
os . makedirs ( save_folder , exist_ok = True )
predictions . save_meshes ( save_folder )

# Get and save aligned head crops
aligned_heads = predictions . get_aligned_heads ()
for i , head in enumerate ( aligned_heads ):
    cv2 . imwrite ( f"aligned_head_ { i } .png" , head )

print ( f"Detected { len ( predictions . heads ) } heads." )
print ( f"Result image saved as 'result.png'" )
print ( f"Head meshes saved in ' { save_folder } ' folder" )
print ( f"Aligned head crops saved as 'aligned_head_*.png'" )

يوضح هذا المثال الممتد كيفية استخدام جميع ميزات نموذج VGGHeads ، بما في ذلك اكتشاف الرأس الأساسي ، ونتائج الرسم ، وتصدير شبكات الرأس ، والحصول على محاصيل الرأس المحاذاة.

بالإضافة إلى ذلك ، تتوفر أوزان ONNX في Huggingface. يمكن العثور على مثال الاستدلال على: كولاب

Gradio Demo

نحن نقدم أيضًا عرضًا تجريبيًا ، يمكنك تشغيله محليًا:

 cd gradio
pip install -r requirements.txt
python app.py

يمكنك تحديد وسيطات --server_port ، --share ، --server_name لتلبية احتياجاتك!

تمرين

تحقق من yolo_head_training/Makefile للحصول على أمثلة على البرامج النصية للقطار.

لتشغيل التدريب على جميع البيانات مع البيانات الموزعة الموازية (DDP) ، استخدم الأمر التالي:

torchrun --standalone --nnodes=1 --nproc_per_node=NUM_GPUS train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large 
    num_gpus=NUM_GPUS multi_gpu=DDP

استبدل العناصر النائبة التالية:

NUM_GPUS : عدد وحدات معالجة الرسومات التي تريد استخدامها للتدريب.
DATA_FOLDER : المسار إلى الدليل الذي يحتوي على مجموعة البيانات المستخرجة.

خيارات تدريب إضافية

تدريب وحدات معالجة الرسومات المفردة: إذا كنت تستخدم وحدة معالجة الرسومات واحدة ، فيمكنك تبسيط الأمر:
```
python train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large
```
التكوين المخصص: يمكنك تعديل المعلمة --config-name لاستخدام تكوينات نموذج مختلفة. تحقق من ملفات التكوين في دليل المشروع للحصول على الخيارات المتاحة.

تعديل أجهزة التمييز المفرطة: يمكنك ضبط العديد من المقاييس الزائدة عن طريق إضافتها إلى سطر الأوامر. على سبيل المثال:

python train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large 
    training_hyperparams.initial_lr=0.001 
    training_hyperparams.max_epochs=100

تدريب استئناف: إذا كنت بحاجة إلى استئناف التدريب من نقطة تفتيش ، فيمكنك استخدام training_hyperparams.resume : العلم:

python train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large 
    training_hyperparams.resume=True

مراقبة التدريب

يمكنك مراقبة تقدم التدريب من خلال إخراج وحدة التحكم. فكر في استخدام أدوات مثل Tensorboard لمزيد من المراقبة والتصور لمقاييس التدريب.

استشهد

إذا وجدت vggheads مفيدة للبحث والتطبيقات الخاصة بك ، فيرجى الاستشهاد بنا باستخدام هذا bibtex:

 @article { vggheads ,
      title = { VGGHeads: A Large-Scale Synthetic Dataset for 3D Human Heads } ,
      author = { Orest Kupyn and Eugene Khvedchenia and Christian Rupprecht } ,
      year = { 2024 } ,
      eprint = { 2407.18245 } ,
      archivePrefix = { arXiv } ,
      primaryClass = { cs.CV } ,
      url = { https://arxiv.org/abs/2407.18245 } ,
}

تم ترخيص هذا العمل بموجب ترخيص Creative Commons Attribution-Noncommercial 4.0 الدولي.

يوسع

معلومات إضافية

الإصدار 1.0.0
النوع شفرة المصدر الأخرى
وقت التحديث 2025-03-07
الحجم 98.77MB
من Github

تطبيقات ذات صلة

efficient language detector

2024-11-06
نسخة مجانية من فيلم Head Record والتلفزيون

2023-10-30
رئيس O

2022-08-27
ديدان الرأس

2022-08-11
رأس مدرع

2022-08-10
رئيس SQL الأول

2010-03-29

نوصي لك

chat.petals.dev

شفرة المصدر الأخرى

1.0.0
GPT Prompt Templates

شفرة المصدر الأخرى

1.0.0
GPTyped

شفرة المصدر الأخرى

GPTyped 1.0.5
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3
Google Dorks

شفرة المصدر الأخرى

1.0
shepherd

شفرة المصدر الأخرى

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

شفرة المصدر الأخرى

v1.1.0-rc-3

أخبار ذات صلة الكل