Eine Pytorch -Implementierung eines leichten CNN für eine tiefe Gesichtsdarstellung mit lauten Etiketten aus dem Papier von Xiang Wu, Ran He, Zhenan Sun und Tieniu Tan. Der offizielle und ursprüngliche Caffe -Code finden Sie hier.
100% - EER auf LFW erreicht 99,43% .100% - EER auf LFW erreicht 99,40% .100% - EER auf LFW erhält 98,70% .Laden Sie das Gesichtsdatensatz wie Casia-Webface, VGG-Face und MS-Celeb-1M herunter.
Alle Gesichtsbilder werden in Graustufenbilder umgewandelt und gemäß den Wahrzeichen auf 144x144 normalisiert.
Nach den fünf Gesichtspunkten drehen wir nicht nur zwei Augenpunkte horizontal, sondern setzen auch den Abstand zwischen dem Mittelpunkt der Augen und dem Mundpunkt (EC_MC_Y) und der y -Achse der Augen (EC_Y).
Die ausgerichteten LFW -Bilder werden auf Baidu Yun hochgeladen.
| Datensatz | Größe | EC_MC_Y | EC_Y |
|---|---|---|---|
| Trainingset | 144x144 | 48 | 48 |
| Testset | 128x128 | 48 | 40 |
train.py aufgeführten Parameter als Flagge an oder ändern Sie sie manuell. python train.py --root_path=/path/to/your/datasets/
--train_list=/path/to/your/train/list.txt
--val_list=/path/to/your/val/list.txt
--save_path=/path/to/your/save/path/
--model= " LightCNN-9/LightCNN-29 " --num_classes=nload_imglist.py angezeigt. Oder Sie können torchvision.datasets.ImageFolder verwenden, um Ihre Datensätze zu laden.num_classes bezeichnet die Anzahl der Identitäten in Ihrem Trainingsdatensatz.num_classes 80013 . python extract_features.py --resume=/path/to/your/model
--root_path=/path/to/your/datasets/
--img_list=/path/to/your/list.txt
--save_path=/path/to/your/save/path/
--model="LightCNN-9/LightCNN-29/LightCNN-29v2"
--num_classes=n (79077 for LightCNN-9/LightCNN-29, 80013 for LightCNN-29v2)
vlfeat oder sklearn verwenden, um die Funktionen auf ROC zu bewerten und EER und TPR@FPR für Ihre Testdatensätze zu erhalten.train.py .Die leichte CNN -Leistung auf LFW 6.000 Paaren.
| Modell | 100% - EER | TPR@far = 1% | TPr@far=0.1%% | TPR@far = 0 |
|---|---|---|---|---|
| Lightcnn-9 | 98,70% | 98,47% | 95,13% | 89,53% |
| Lightcnn-29 | 99,40% | 99,43% | 98,67% | 95,70% |
| Lightcnn-29v2 | 99,43% | 99,53% | 99,30% | 96,77% |
| Lightcnn v4 | 99,67% | 99,67% | 99,57% | 99,27% |
Die leichte CNN -Leistung auf LFW -Blufr -Protokollen
| Modell | Vr@far=0.1%% | Dir@far = 1% |
|---|---|---|
| Lightcnn-9 | 96,80% | 83,06% |
| Lightcnn-29 | 98,95% | 91,33% |
| Lightcnn-29v2 | 99,41% | 94,43% |
Die leichte CNN -Leistung auf Megaface
| Modell | Rang-1 | TPR@far = 1E-6 |
|---|---|---|
| Lightcnn-9 | 65,782% | 76,288% |
| Lightcnn-29 | 72,704% | 85,891% |
| Lightcnn-29v2 | 76,021% | 89,740% |
Wenn Sie unsere Modelle verwenden, zitieren Sie bitte das folgende Papier:
@article{wu2018light,
title={A light CNN for deep face representation with noisy labels},
author={Wu, Xiang and He, Ran and Sun, Zhenan and Tan, Tieniu},
journal={IEEE Transactions on Information Forensics and Security},
volume={13},
number={11},
pages={2884--2896},
year={2018},
publisher={IEEE}
}