head_detector下载head_detector源代码下载

head_detector

其他源码

1.0.0

下载

vggheads：3D人头的大规模合成数据集

Orest Kupyn ¹³ · Eugene Khvedchenia ² ·基督徒Rupprecht ¹ ·

¹牛津大学· ²乌克兰天主教大学· ^{3PiñataFarmsAI}

VGGHEADS是用于人头检测的大规模完全合成数据集和3D网格估计，具有超过100万张图像的扩散模型。仅在合成数据上训练的模型可以很好地推广到现实世界，并且能够同时从单个步骤中从单个图像中进行重建。

消息

[2024/08/30]版本0.1.0版本。添加了头部对齐和保存网格的示例为.obj
[2024/08/29]我们发布数据集，培训说明和ONNX权重！
[2024/08/09]我们发布vggheads_l检查点和网格控制网
[2024/07/26]我们发布了代码库，纸张，项目网页和图像演示的初始版本！

vggheads数据集下载说明

1。下载数据集

要下载vggheads数据集，您有两个选择：

洪流下载（首选方法）：如何下载

pip install academictorrents
at-get 1ac36f16386061685ed303dea6f0d6179d2e2121

或使用Aria2c

aria2c --seed-time=0 --max-overall-download-limit=10M --file-allocation=none https://academictorrents.com/download/1ac36f16386061685ed303dea6f0d6179d2e2121.torrent

完整的洪流链接

我们建议使用洪流方法，因为它通常更快，并有助于减少服务器上的负载。

直接下载：

wget https://thor.robots.ox.ac.uk/vgg-heads/VGGHeads.tar

这将下载一个名为VGGHeads.tar的文件到您当前的目录。

2。下载MD5校验和

为了验证下载文件的完整性，我们需要MD5校验和。使用以下方式下载它们：

wget https://thor.robots.ox.ac.uk/vgg-heads/MD5SUMS

3。验证下载

下载两个文件后，验证VGGHeads.tar文件的完整性：

md5sum -c MD5SUMS

如果下载成功并且文件完好无损，则应该看到一条“确定”消息。

4。提取数据集

如果验证成功，请提取焦油文件的内容：

tar -xvf VGGHeads.tar

这将将存档的内容提取到您当前的目录中。

笔记：

数据集的大小约为187 GB。在下载和提取之前，请确保您有足够的磁盘空间。
下载和提取过程可能需要一些时间，具体取决于您的Internet连接和计算机速度。
如果您在下载或提取过程中遇到任何问题，请再次尝试下载或检查系统的TAR实用程序。

安装

创建一个conda虚拟环境

conda create --name vgg_heads python=3.10
conda activate vgg_heads

克隆项目并安装软件包

git clone https://github.com/KupynOrest/head_detector.git
cd head_detector

pip install -e ./

或简单地安装

pip install git+https://github.com/KupynOrest/head_detector.git

用法

要在您自己的图像上测试VGGHEADS模型，只需使用以下代码：

 from head_detector import HeadDetector
import cv2
detector = HeadDetector ()
image_path = "your_image.jpg"
predictions = detector ( image_path )
# predictions.heads contain a list of heads with .bbox, .vertices_3d, .head_pose params
result_image = predictions . draw () # draw heads on the image
cv2 . imwrite ( "result.png" , result_image ) # save result image to preview it.

出口头网

您可以使用save_meshes方法将头部网格作为OBJ文件导出：

 # After getting predictions
save_folder = "path/to/save/folder"
predictions . save_meshes ( save_folder )

这将保存指定文件夹中每个检测到的头部的单个OBJ文件。

放置头部作物

要获得对齐的头部作物，请使用get_aligned_heads方法：

 # After getting predictions
aligned_heads = predictions . get_aligned_heads ()

# Process or save aligned head crops
for i , head in enumerate ( aligned_heads ):
    cv2 . imwrite ( f"aligned_head_ { i } .png" , head )

这返回了您可以进一步加工或保存的一排式头部作物列表。

扩展示例

这是一个结合所有功能的完整示例：

 from head_detector import HeadDetector
import cv2
import os

# Initialize the detector
detector = HeadDetector ()

# Specify the path to your image
image_path = "your_image.jpg"

# Get predictions
predictions = detector ( image_path )

# Draw heads on the image
result_image = predictions . draw ()
cv2 . imwrite ( "result.png" , result_image )

# Save head meshes
save_folder = "head_meshes"
os . makedirs ( save_folder , exist_ok = True )
predictions . save_meshes ( save_folder )

# Get and save aligned head crops
aligned_heads = predictions . get_aligned_heads ()
for i , head in enumerate ( aligned_heads ):
    cv2 . imwrite ( f"aligned_head_ { i } .png" , head )

print ( f"Detected { len ( predictions . heads ) } heads." )
print ( f"Result image saved as 'result.png'" )
print ( f"Head meshes saved in ' { save_folder } ' folder" )
print ( f"Aligned head crops saved as 'aligned_head_*.png'" )

这个扩展的示例演示了如何使用VGGHEADS模型的所有功能，包括基本的头部检测，绘制结果，导出头部网格以及获得对齐的头部作物。

此外，在HuggingFace上还可以使用ONNX权重。可以在：COLAB上找到推理的例子

Gradio演示

我们还提供了一个Gradio演示，您可以在本地运行：

 cd gradio
pip install -r requirements.txt
python app.py

您可以指定--server_port ， --share ， --server_name参数以满足您的需求！

训练

检查yolo_head_training/Makefile以获取火车脚本的示例。

要使用并行分布式数据（DDP）对所有数据进行培训，请使用以下命令：

torchrun --standalone --nnodes=1 --nproc_per_node=NUM_GPUS train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large 
    num_gpus=NUM_GPUS multi_gpu=DDP

替换以下占位符：

NUM_GPUS ：您要用于培训的GPU数量。
DATA_FOLDER ：通往包含您提取的数据集的目录的路径。

其他培训选项

单个GPU培训：如果您使用的是单个GPU，则可以简化命令：

python train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large

自定义配置：您可以修改--config-name参数以使用不同的模型配置。检查项目目录中的配置文件以获取可用选项。

调整超参数：您可以通过将它们添加到命令行中调整各种超参数。例如：

python train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large 
    training_hyperparams.initial_lr=0.001 
    training_hyperparams.max_epochs=100

恢复培训：如果您需要从检查站恢复培训，则可以使用training_hyperparams.resume flag：

python train.py --config-name=yolo_heads_l 
    dataset_params.train_dataset_params.data_dir=DATA_FOLDER/large 
    dataset_params.val_dataset_params.data_dir=DATA_FOLDER/large 
    training_hyperparams.resume=True

监视培训

您可以通过控制台输出监视训练进度。考虑使用张量板等工具，以更详细的监视和可视化培训指标。

引用

如果您发现Vggheads对您的研究和应用程序有用，请使用此Bibtex引用我们：

 @article { vggheads ,
      title = { VGGHeads: A Large-Scale Synthetic Dataset for 3D Human Heads } ,
      author = { Orest Kupyn and Eugene Khvedchenia and Christian Rupprecht } ,
      year = { 2024 } ,
      eprint = { 2407.18245 } ,
      archivePrefix = { arXiv } ,
      primaryClass = { cs.CV } ,
      url = { https://arxiv.org/abs/2407.18245 } ,
}

这项工作是根据创意共享归因于非商业4.0国际许可证获得许可的。

展开

附加信息

版本 1.0.0
类型其他源码
更新时间 2025-03-07
大小 98.77MB
来自于 Github

head_detector

vggheads：3D人头的大规模合成数据集

消息

vggheads数据集下载说明

1。下载数据集

2。下载MD5校验和

3。验证下载

4。提取数据集

安装

创建一个conda虚拟环境

克隆项目并安装软件包

用法

出口头网

放置头部作物

扩展示例

Gradio演示

训练

其他培训选项

监视培训

引用

efficient language detector

Head记录影视免费版

头O

头虫

装甲头

头部优先 SQL

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express