Uma implementação de Pytorch de uma CNN leve para a representação de rosto profundo com rótulos barulhentos do artigo de Xiang Wu, Ran He, Zhenan Sun e Tieniu Tan. O código oficial e original da Caffe pode ser encontrado aqui.
100% - EER no LFW alcança 99,43% .100% - EER no LFW alcança 99,40% .100% - EER no LFW obtém 98,70% .Faça o download do conjunto de dados de rosto como Casia-Webface, VGG-Face e MS-CELEB-1M.
Todas as imagens de rosto são convertidas em imagens em escala de cinza e normalizadas para 144x144 de acordo com os marcos.
De acordo com os cinco pontos faciais, não apenas giramos dois pontos oculares horizontalmente, mas também definimos a distância entre o ponto médio dos olhos e o ponto médio da boca (EC_MC_Y) e o eixo y do ponto médio dos olhos (EC_Y).
As imagens LFW alinhadas são carregadas no Baidu Yun.
| Conjunto de dados | tamanho | ec_mc_y | ec_y |
|---|---|---|---|
| Conjunto de treinamento | 144x144 | 48 | 48 |
| Conjunto de testes | 128x128 | 48 | 40 |
train.py como uma bandeira ou alterá -los manualmente. python train.py --root_path=/path/to/your/datasets/
--train_list=/path/to/your/train/list.txt
--val_list=/path/to/your/val/list.txt
--save_path=/path/to/your/save/path/
--model= " LightCNN-9/LightCNN-29 " --num_classes=nload_imglist.py . Ou você pode usar torchvision.datasets.ImageFolder para carregar seus conjuntos de dados.num_classes indica o número de identidades no seu conjunto de dados de treinamento.num_classes é 80013 . python extract_features.py --resume=/path/to/your/model
--root_path=/path/to/your/datasets/
--img_list=/path/to/your/list.txt
--save_path=/path/to/your/save/path/
--model="LightCNN-9/LightCNN-29/LightCNN-29v2"
--num_classes=n (79077 for LightCNN-9/LightCNN-29, 80013 for LightCNN-29v2)
vlfeat ou sklearn para avaliar os recursos no ROC e obter EER e TPR@FPR para seus conjuntos de dados de teste.train.pyO desempenho da CNN leve em LFW 6.000 pares.
| Modelo | 100% - eer | TPR@FAR = 1% | Tpr@far=0.1% | TPR@FAR = 0 |
|---|---|---|---|---|
| Lightcnn-9 | 98,70% | 98,47% | 95,13% | 89,53% |
| Lightcnn-29 | 99,40% | 99,43% | 98,67% | 95,70% |
| Lightcnn-29v2 | 99,43% | 99,53% | 99,30% | 96,77% |
| Lightcnn v4 | 99,67% | 99,67% | 99,57% | 99,27% |
O desempenho da CNN leve nos protocolos LFW Blufr
| Modelo | Vr@far=0.1% | Dir@distante = 1% |
|---|---|---|
| Lightcnn-9 | 96,80% | 83,06% |
| Lightcnn-29 | 98,95% | 91,33% |
| Lightcnn-29v2 | 99,41% | 94,43% |
O desempenho da CNN leve no megaface
| Modelo | Rank-1 | TPR@FAR = 1E-6 |
|---|---|---|
| Lightcnn-9 | 65,782% | 76,288% |
| Lightcnn-29 | 72,704% | 85,891% |
| Lightcnn-29v2 | 76,021% | 89,740% |
Se você usar nossos modelos, cite o seguinte artigo:
@article{wu2018light,
title={A light CNN for deep face representation with noisy labels},
author={Wu, Xiang and He, Ran and Sun, Zhenan and Tan, Tieniu},
journal={IEEE Transactions on Information Forensics and Security},
volume={13},
number={11},
pages={2884--2896},
year={2018},
publisher={IEEE}
}