Download de head_detector - head_detector Código Fonte Download

head_detector

Outro código-fonte

1.0.0

Baixar

VGGHEADS: um conjunto de dados sintéticos em larga escala para cabeças humanas 3D

Orest Kupyn ¹³ · Eugene Khvedchenia ² · Christian Rupprecht ¹ ·

¹ Universidade de Oxford · ² Universidade Católica Ucraniana · ³ PiñataFarms AI

O VGGHEADS é um conjunto de dados totalmente sintético em larga escala para detecção de cabeça humana e estimativa de malha 3D, com mais de 1 milhão de imagens geradas com modelos de difusão. Um modelo treinado apenas em dados sintéticos generaliza bem para o mundo real e é capaz de detecção de cabeças simultâneas e reconstrução de malhas da cabeça de uma única imagem em uma única etapa.

bandeira

Notícias

[2024/08/30] Versão de liberação 0.1.0. Adicionado exemplos de alinhamento da cabeça e salvamento de malhas como .obj
[2024/08/29] Lançamos o conjunto de dados, instruções de treinamento e pesos de Onnx !!
[2024/08/09] Lançamos VGGHEADS_L Ponto de verificação e controle de malha
[2024/07/26] Lançamos a versão inicial da base de código, a página de papel, o projeto do projeto e uma demonstração de imagem !!

Instruções de download do conjunto de dados VGGHEADS

1. Faça o download do conjunto de dados

Para baixar o conjunto de dados VGGHEADS, você tem duas opções:

Download de torrent (método preferido): como baixar

pip install academictorrents
at-get 1ac36f16386061685ed303dea6f0d6179d2e2121

ou use ARIA2C

aria2c --seed-time=0 --max-overall-download-limit=10M --file-allocation=none https://academictorrents.com/download/1ac36f16386061685ed303dea6f0d6179d2e2121.torrent

Link completo de torrent

Recomendamos o uso do método torrent, pois normalmente é mais rápido e ajuda a reduzir a carga em nossos servidores.

Download direto:

wget https://thor.robots.ox.ac.uk/vgg-heads/VGGHeads.tar

Isso baixará um arquivo chamado VGGHeads.tar para o seu diretório atual.

2. Faça o download das somas de cheques do MD5

Para verificar a integridade do arquivo baixado, precisaremos das somas de verificação do MD5. Baixe -os usando:

wget https://thor.robots.ox.ac.uk/vgg-heads/MD5SUMS

3. Verifique o download

Depois que os dois arquivos forem baixados, verifique a integridade do arquivo VGGHeads.tar :

md5sum -c MD5SUMS

Se o download foi bem -sucedido e o arquivo estiver intacto, você deverá ver uma mensagem "OK".

4. Extraia o conjunto de dados

Se a verificação foi bem -sucedida, extraia o conteúdo do arquivo TAR:

tar -xvf VGGHeads.tar

Isso extrairá o conteúdo do arquivo para o seu diretório atual.

Notas:

O tamanho do conjunto de dados é de aproximadamente 187 GB. Certifique -se de ter espaço em disco suficiente antes de baixar e extrair.
O processo de download e extração pode levar algum tempo, dependendo da sua conexão com a Internet e velocidade do computador.
Se você encontrar algum problema durante o processo de download ou extração, tente o download novamente ou verifique o utilitário tar do seu sistema.

Instalação

Crie um ambiente virtual do conda

conda create --name vgg_heads python=3.10
conda activate vgg_heads

Clone o projeto e instale o pacote

git clone https://github.com/KupynOrest/head_detector.git
cd head_detector

pip install -e ./

Ou simplesmente instalar

pip install git+https://github.com/KupynOrest/head_detector.git

Uso

Para testar o modelo VGGHEADS em suas próprias imagens, basta usar este código:

 from head_detector import HeadDetector
import cv2
detector = HeadDetector ()
image_path = "your_image.jpg"
predictions = detector ( image_path )
# predictions.heads contain a list of heads with .bbox, .vertices_3d, .head_pose params
result_image = predictions . draw () # draw heads on the image
cv2 . imwrite ( "result.png" , result_image ) # save result image to preview it.

Exportação de malhas da cabeça

Você pode exportar malhas de cabeça como arquivos OBJ usando o método save_meshes :

 # After getting predictions
save_folder = "path/to/save/folder"
predictions . save_meshes ( save_folder )

Isso salvará arquivos OBJ individuais para cada cabeça detectada na pasta especificada.

Fazendo culturas de cabeça alinhadas

Para obter culturas de cabeça alinhadas, use o método get_aligned_heads :

 # After getting predictions
aligned_heads = predictions . get_aligned_heads ()

# Process or save aligned head crops
for i , head in enumerate ( aligned_heads ):
    cv2 . imwrite ( f"aligned_head_ { i } .png" , head )

Isso retorna uma lista de culturas de cabeça alinhadas que você pode processar ou salvar ainda mais.

Exemplo estendido

Aqui está um exemplo completo incorporando todos os recursos:

 from head_detector import HeadDetector
import cv2
import os

# Initialize the detector
detector = HeadDetector ()

# Specify the path to your image
image_path = "your_image.jpg"

# Get predictions
predictions = detector ( image_path )

# Draw heads on the image
result_image = predictions . draw ()
cv2 . imwrite ( "result.png" , result_image )

# Save head meshes
save_folder = "head_meshes"
os . makedirs ( save_folder , exist_ok = True )
predictions . save_meshes ( save_folder )

# Get and save aligned head crops
aligned_heads = predictions . get_aligned_heads ()
for i , head in enumerate ( aligned_heads ):
    cv2 . imwrite ( f"aligned_head_ { i } .png" , head )

print ( f"Detected { len ( predictions . heads ) } heads." )
print ( f"Result image saved as 'result.png'" )
print ( f"Head meshes saved in ' { save_folder } ' folder" )
print ( f"Aligned head crops saved as 'aligned_head_*.png'" )

Este exemplo estendido demonstra como usar todos os recursos do modelo VGGHEADS, incluindo detecção básica de cabeça, resultados de desenho, exportação de malhas da cabeça e obtenção de culturas de cabeça alinhadas.

Além disso, os pesos ONNX estão disponíveis no HuggingFace. O exemplo da inferência pode ser encontrado em: colab

Demo Gradio

Também fornecemos uma demonstração de graduação, que você pode executar localmente:

 cd gradio
pip install -r requirements.txt
python app.py

Você pode especificar os argumentos --server_port , --share , --server_name para satisfazer suas necessidades!

Treinamento

Verifique yolo_head_training/Makefile para obter exemplos de scripts de trem.

Para executar o treinamento em todos os dados com dados distribuídos paralelos (DDP), use o seguinte comando:

torchrun --standalone --nnodes=1 --nproc_per_node=NUM_GPUS train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large 
    num_gpus=NUM_GPUS multi_gpu=DDP

Substitua os seguintes espaços reservados:

NUM_GPUS : o número de GPUs que você deseja usar para treinamento.
DATA_FOLDER : o caminho para o diretório que contém seu conjunto de dados extraído.

Opções de treinamento adicionais

Treinamento de GPU único: se você estiver usando uma única GPU, poderá simplificar o comando:

python train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large

Configuração personalizada: você pode modificar o parâmetro --config-name para usar diferentes configurações de modelo. Verifique os arquivos de configuração no diretório do projeto para obter opções disponíveis.

Ajustando os hiperparâmetros: você pode ajustar vários hiperparâmetros adicionando -os à linha de comando. Por exemplo:

python train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large 
    training_hyperparams.initial_lr=0.001 
    training_hyperparams.max_epochs=100

Retomando o treinamento: se você precisar retomar o treinamento do ponto de verificação, poderá usar o sinalizador training_hyperparams.resume : Hyperparams.resume:

python train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large 
    training_hyperparams.resume=True

Monitoramento do treinamento

Você pode monitorar o progresso do treinamento através da saída do console. Considere o uso de ferramentas como o Tensorboard para um monitoramento e visualização mais detalhados das métricas de treinamento.

Citar

Se você achar vggheads úteis para sua pesquisa e aplicativos, cite -nos usando este Bibtex:

 @article { vggheads ,
      title = { VGGHeads: A Large-Scale Synthetic Dataset for 3D Human Heads } ,
      author = { Orest Kupyn and Eugene Khvedchenia and Christian Rupprecht } ,
      year = { 2024 } ,
      eprint = { 2407.18245 } ,
      archivePrefix = { arXiv } ,
      primaryClass = { cs.CV } ,
      url = { https://arxiv.org/abs/2407.18245 } ,
}

Este trabalho é licenciado sob uma licença Creative Commons Attribution-NonCommercial 4.0 International.

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-03-07
tamanho 98.77MB
Vindo de Github

Aplicativos Relacionados

efficient language detector

2024-11-06
Versão gratuita de filme e televisão Head Record

2023-10-30
Cabeça O

2022-08-27
Vermes de cabeça

2022-08-11
CABEÇA BLINDADA

2022-08-10
Use a cabeça primeiro SQL

2010-03-29

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos