Una implementación de Pytorch de un CNN ligero para una representación de cara profunda con etiquetas ruidosas del papel de Xiang Wu, dirigió He, Zhenan Sun y Tieniu Tan. El código Caffe oficial y original se puede encontrar aquí.
100% - EER en LFW logra 99.43% .100% - EER en LFW logra 99.40% .100% - EER en LFW obtiene 98.70% .Descargue el conjunto de datos de cara como Casia-Webface, VGG-FACE y MS-CELEB-1M.
Todas las imágenes faciales se convierten en imágenes a escala de grises y se normalizan a 144x144 de acuerdo con los puntos de referencia.
Según los cinco puntos faciales, no solo giramos dos puntos de ojos horizontalmente, sino que también establecemos la distancia entre el punto medio de los ojos y el punto medio de la boca (EC_MC_Y), y el eje y del punto medio de los ojos (EC_Y).
Las imágenes LFW alineadas se cargan en Baidu Yun.
| Conjunto de datos | tamaño | EC_MC_Y | EC_Y |
|---|---|---|---|
| Set de entrenamiento | 144x144 | 48 | 48 |
| Conjunto de pruebas | 128x128 | 48 | 40 |
train.py como una bandera o cambiarlos manualmente. python train.py --root_path=/path/to/your/datasets/
--train_list=/path/to/your/train/list.txt
--val_list=/path/to/your/val/list.txt
--save_path=/path/to/your/save/path/
--model= " LightCNN-9/LightCNN-29 " --num_classes=nload_imglist.py . O puede usar torchvision.datasets.ImageFolder para cargar sus conjuntos de datos.num_classes denota el número de identidades en su conjunto de datos de capacitación.num_classes es 80013 . python extract_features.py --resume=/path/to/your/model
--root_path=/path/to/your/datasets/
--img_list=/path/to/your/list.txt
--save_path=/path/to/your/save/path/
--model="LightCNN-9/LightCNN-29/LightCNN-29v2"
--num_classes=n (79077 for LightCNN-9/LightCNN-29, 80013 for LightCNN-29v2)
vlfeat o sklearn para evaluar las características en ROC y obtener EER y TPR@FPR para sus conjuntos de datos de prueba.train.py .El rendimiento ligero de CNN en LFW 6,000 pares.
| Modelo | 100% - EER | TPR@FAR = 1% | Tpr@far=0.1% | TPR@FAR = 0 |
|---|---|---|---|---|
| Lightcnn-9 | 98.70% | 98.47% | 95.13% | 89.53% |
| Lightcnn-29 | 99.40% | 99.43% | 98.67% | 95.70% |
| Lightcnn-29v2 | 99.43% | 99.53% | 99.30% | 96.77% |
| Lightcnn v4 | 99.67% | 99.67% | 99.57% | 99.27% |
El rendimiento de la luz de la luz en los protocolos BLUFR LFW
| Modelo | Vr@far=0.1% | Dir@Far = 1% |
|---|---|---|
| Lightcnn-9 | 96.80% | 83.06% |
| Lightcnn-29 | 98.95% | 91.33% |
| Lightcnn-29v2 | 99.41% | 94.43% |
El rendimiento ligero de CNN en megaface
| Modelo | Rango-1 | TPR@FAR = 1E-6 |
|---|---|---|
| Lightcnn-9 | 65.782% | 76.288% |
| Lightcnn-29 | 72.704% | 85.891% |
| Lightcnn-29v2 | 76.021% | 89.740% |
Si usa nuestros modelos, cite el siguiente documento:
@article{wu2018light,
title={A light CNN for deep face representation with noisy labels},
author={Wu, Xiang and He, Ran and Sun, Zhenan and Tan, Tieniu},
journal={IEEE Transactions on Information Forensics and Security},
volume={13},
number={11},
pages={2884--2896},
year={2018},
publisher={IEEE}
}