Une mise en œuvre en pytorch d'un CNN léger pour une représentation profonde avec le visage avec des étiquettes bruyantes du papier de Xiang Wu, a dirigé He, Zhenan Sun et Tieniu Tan. Le code CAFFE officiel et original peut être trouvé ici.
100% - EER sur LFW atteint 99,43% .100% - EER sur LFW atteint 99,40% .100% - EER sur LFW obtient 98,70% .Téléchargez un ensemble de données de face tels que Casia-Webface, VGG-FACE et MS-Celeb-1m.
Toutes les images du visage sont converties en images à l'échelle grise et normalisées en 144x144 selon les points de repère.
Selon les cinq points faciaux, nous tournons non seulement deux points oculaires horizontalement mais fixons également la distance entre le point médian des yeux et le milieu de la bouche (EC_MC_Y), et l'axe y du point médian des yeux (EC_Y).
Les images LFW alignées sont téléchargées sur Baidu Yun.
| Ensemble de données | taille | ec_mc_y | ec_y |
|---|---|---|---|
| Ensemble de formation | 144x144 | 48 | 48 |
| Ensemble de tests | 128x128 | 48 | 40 |
train.py en tant que drapeau ou modifiez-les manuellement. python train.py --root_path=/path/to/your/datasets/
--train_list=/path/to/your/train/list.txt
--val_list=/path/to/your/val/list.txt
--save_path=/path/to/your/save/path/
--model= " LightCNN-9/LightCNN-29 " --num_classes=nload_imglist.py . Ou vous pouvez utiliser torchvision.datasets.ImageFolder pour charger vos ensembles de données.num_classes désigne le nombre d'identités dans votre ensemble de données de formation.num_classes est 80013 . python extract_features.py --resume=/path/to/your/model
--root_path=/path/to/your/datasets/
--img_list=/path/to/your/list.txt
--save_path=/path/to/your/save/path/
--model="LightCNN-9/LightCNN-29/LightCNN-29v2"
--num_classes=n (79077 for LightCNN-9/LightCNN-29, 80013 for LightCNN-29v2)
vlfeat ou sklearn pour évaluer les fonctionnalités sur ROC et obtenir EER et TPR@FPR pour vos ensembles de données de test.train.py .Les performances CNN légères sur LFW 6 000 paires.
| Modèle | 100% - Eer | Tpr @ far = 1% | Tpr@far=0.1% | Tpr @ far = 0 |
|---|---|---|---|---|
| Lightcnn-9 | 98,70% | 98,47% | 95,13% | 89,53% |
| LightCNN-29 | 99,40% | 99,43% | 98,67% | 95,70% |
| Lightcnn-29v2 | 99,43% | 99,53% | 99,30% | 96,77% |
| Lightcnn v4 | 99,67% | 99,67% | 99,57% | 99,27% |
Les performances CNN légères sur les protocoles LFW Blufr
| Modèle | Vr@far=0.1% | Dir @ far = 1% |
|---|---|---|
| Lightcnn-9 | 96,80% | 83,06% |
| LightCNN-29 | 98,95% | 91,33% |
| Lightcnn-29v2 | 99,41% | 94,43% |
La performance légère CNN sur Megaface
| Modèle | Rank-1 | Tpr @ far = 1e-6 |
|---|---|---|
| Lightcnn-9 | 65,782% | 76,288% |
| LightCNN-29 | 72,704% | 85,891% |
| Lightcnn-29v2 | 76,021% | 89,740% |
Si vous utilisez nos modèles, veuillez citer l'article suivant:
@article{wu2018light,
title={A light CNN for deep face representation with noisy labels},
author={Wu, Xiang and He, Ran and Sun, Zhenan and Tan, Tieniu},
journal={IEEE Transactions on Information Forensics and Security},
volume={13},
number={11},
pages={2884--2896},
year={2018},
publisher={IEEE}
}