Descarga de head_detector - Código fuente head

head_detector

Otro código fuente

1.0.0

Descargar

VGGheads: un conjunto de datos sintético a gran escala para cabezas humanas 3D

Orest Kupyn ¹³ · Eugene Khvedchenia ² · Christian Rupprecht ¹ ·

¹ Universidad de Oxford · ² Universidad Católica ucraniana · ³ piñatafarms ai

VGGheads es un conjunto de datos totalmente sintético a gran escala para la detección de la cabeza humana y la estimación de malla 3D con más de 1 millón de imágenes generadas con modelos de difusión. Un modelo entrenado solo en datos sintéticos se generaliza bien al mundo real y es capaz de detección de cabezas simultáneas y reconstrucción de mallas de cabeza desde una sola imagen en un solo paso.

bandera

Noticias

[2024/08/30] Versión de lanzamiento 0.1.0. Se agregaron ejemplos de alineación de la cabeza y mallas de ahorro como .OBJ
[2024/08/29] ¡Lanzamos el conjunto de datos, las instrucciones de entrenamiento y las pesas ONNX!
[2024/08/09] Lanzamos el punto de control de VGGHEADS_L y el control de malla
[2024/07/26] ¡Lanzamos la versión inicial de la base de código, el documento, la página web del proyecto y una demostración de imagen!

Instrucciones de descarga del conjunto de datos vggheads

1. Descargue el conjunto de datos

Para descargar el conjunto de datos VGGheads, tiene dos opciones:

Descarga de torrent (método preferido): cómo descargar

pip install academictorrents
at-get 1ac36f16386061685ed303dea6f0d6179d2e2121

o usar aria2c

aria2c --seed-time=0 --max-overall-download-limit=10M --file-allocation=none https://academictorrents.com/download/1ac36f16386061685ed303dea6f0d6179d2e2121.torrent

Enlace de torrent completo

Recomendamos usar el método Torrent, ya que es típicamente más rápido y ayuda a reducir la carga en nuestros servidores.

Descarga directa:

wget https://thor.robots.ox.ac.uk/vgg-heads/VGGHeads.tar

Esto descargará un archivo llamado VGGHeads.tar a su directorio actual.

2. Descargue las suma de verificación MD5

Para verificar la integridad del archivo descargado, necesitaremos las suma de verificación MD5. Descarglos usando:

wget https://thor.robots.ox.ac.uk/vgg-heads/MD5SUMS

3. Verifique la descarga

Después de descargar ambos archivos, verifique la integridad del archivo VGGHeads.tar :

md5sum -c MD5SUMS

Si la descarga fue exitosa y el archivo está intacto, debería ver un mensaje "OK".

4. Extraiga el conjunto de datos

Si la verificación fue exitosa, extraiga el contenido del archivo TAR:

tar -xvf VGGHeads.tar

Esto extraerá el contenido del archivo en su directorio actual.

Notas:

El tamaño del conjunto de datos es de aproximadamente 187 GB. Asegúrese de tener suficiente espacio en disco antes de descargar y extraer.
El proceso de descarga y extracción puede llevar algún tiempo dependiendo de su conexión a Internet y la velocidad de la computadora.
Si encuentra algún problema durante el proceso de descarga o extracción, intente descargar nuevamente o verifique la utilidad de alquitrán de su sistema.

Instalación

Crea un entorno virtual de conda

conda create --name vgg_heads python=3.10
conda activate vgg_heads

Clonar el proyecto e instalar el paquete

git clone https://github.com/KupynOrest/head_detector.git
cd head_detector

pip install -e ./

O simplemente instalar

pip install git+https://github.com/KupynOrest/head_detector.git

Uso

Para probar el modelo VGGheads en sus propias imágenes, simplemente use este código:

 from head_detector import HeadDetector
import cv2
detector = HeadDetector ()
image_path = "your_image.jpg"
predictions = detector ( image_path )
# predictions.heads contain a list of heads with .bbox, .vertices_3d, .head_pose params
result_image = predictions . draw () # draw heads on the image
cv2 . imwrite ( "result.png" , result_image ) # save result image to preview it.

Exportando mallas de la cabeza

Puede exportar mallas de cabeza como archivos OBJ utilizando el método save_meshes :

 # After getting predictions
save_folder = "path/to/save/folder"
predictions . save_meshes ( save_folder )

Esto guardará archivos OBJ individuales para cada cabezal detectado en la carpeta especificada.

Estar alineado cultivos de cabeza

Para obtener cultivos de cabeza alineados, use el método get_aligned_heads :

 # After getting predictions
aligned_heads = predictions . get_aligned_heads ()

# Process or save aligned head crops
for i , head in enumerate ( aligned_heads ):
    cv2 . imwrite ( f"aligned_head_ { i } .png" , head )

Esto devuelve una lista de cultivos de cabeza alineados que puede procesar o guardar más.

Ejemplo extendido

Aquí hay un ejemplo completo que incorpora todas las características:

 from head_detector import HeadDetector
import cv2
import os

# Initialize the detector
detector = HeadDetector ()

# Specify the path to your image
image_path = "your_image.jpg"

# Get predictions
predictions = detector ( image_path )

# Draw heads on the image
result_image = predictions . draw ()
cv2 . imwrite ( "result.png" , result_image )

# Save head meshes
save_folder = "head_meshes"
os . makedirs ( save_folder , exist_ok = True )
predictions . save_meshes ( save_folder )

# Get and save aligned head crops
aligned_heads = predictions . get_aligned_heads ()
for i , head in enumerate ( aligned_heads ):
    cv2 . imwrite ( f"aligned_head_ { i } .png" , head )

print ( f"Detected { len ( predictions . heads ) } heads." )
print ( f"Result image saved as 'result.png'" )
print ( f"Head meshes saved in ' { save_folder } ' folder" )
print ( f"Aligned head crops saved as 'aligned_head_*.png'" )

Este ejemplo extendido demuestra cómo usar todas las características del modelo VGGheads, incluida la detección básica de la cabeza, los resultados del dibujo, la exportación de mallas de la cabeza y la obtención de cultivos de cabeza alineados.

Además, los pesos ONNX están disponibles en Huggingface. El ejemplo de la inferencia se puede encontrar en: Colab

Demostración de Gradio

También proporcionamos una demostración de Gradio, que puede ejecutar localmente:

 cd gradio
pip install -r requirements.txt
python app.py

¡Puede especificar el --server_port , --share , --server_name argumentos para satisfacer sus necesidades!

Capacitación

Consulte yolo_head_training/Makefile para ver ejemplos de scripts de trenes.

Para ejecutar la capacitación en todos los datos con datos distribuidos paralelos (DDP), use el siguiente comando:

torchrun --standalone --nnodes=1 --nproc_per_node=NUM_GPUS train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large 
    num_gpus=NUM_GPUS multi_gpu=DDP

Reemplace los siguientes marcadores de posición:

NUM_GPUS : el número de GPU que desea usar para el entrenamiento.
DATA_FOLDER : la ruta al directorio que contiene su conjunto de datos extraído.

Opciones de capacitación adicionales

Entrenamiento único de GPU: si está utilizando una sola GPU, puede simplificar el comando:

python train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large

Configuración personalizada: puede modificar el parámetro --config-name para usar diferentes configuraciones de modelo. Verifique los archivos de configuración en el directorio del proyecto para ver las opciones disponibles.

Ajuste de hiperparámetros: puede ajustar varios hiperparámetros agregándolos a la línea de comando. Por ejemplo:

python train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large 
    training_hyperparams.initial_lr=0.001 
    training_hyperparams.max_epochs=100

Entrenamiento de reanudación: si necesita reanudar la capacitación desde un punto de control, puede usar la bandera de training_hyperparams.resume :

python train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large 
    training_hyperparams.resume=True

Capacitación de monitoreo

Puede monitorear el progreso de la capacitación a través de la salida de la consola. Considere el uso de herramientas como TensorBoard para un monitoreo y visualización más detallados de las métricas de capacitación.

Citar

Si encuentra útiles para su investigación y aplicaciones, cíquanos usando este bibtex:

 @article { vggheads ,
      title = { VGGHeads: A Large-Scale Synthetic Dataset for 3D Human Heads } ,
      author = { Orest Kupyn and Eugene Khvedchenia and Christian Rupprecht } ,
      year = { 2024 } ,
      eprint = { 2407.18245 } ,
      archivePrefix = { arXiv } ,
      primaryClass = { cs.CV } ,
      url = { https://arxiv.org/abs/2407.18245 } ,
}

Este trabajo tiene licencia bajo una licencia internacional de Atribución de Commons Creative Commons.

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-03-07
tamaño 98.77MB
Proviene de Github

Aplicaciones relacionadas

efficient language detector

2024-11-06
Head record cine y televisión versión gratuita

2023-10-30
cabeza o

2022-08-27
gusanos de cabeza

2022-08-11
CABEZA ARMADA

2022-08-10
Dirígete primero a SQL

2010-03-29

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo