Descargar LightCNN - Descargar el código fuente de LightCNN

LightCNN

Pitón

1.0.0

Descargar

CNN ligero para el reconocimiento de la cara profunda, en Pytorch

Una implementación de Pytorch de un CNN ligero para una representación de cara profunda con etiquetas ruidosas del papel de Xiang Wu, dirigió He, Zhenan Sun y Tieniu Tan. El código Caffe oficial y original se puede encontrar aquí.

Tabla de contenido

Actualizaciones
Instalación
Conjuntos de datos
Capacitación
Evaluar
Actuación
Citación
Referencias

Actualizaciones

9 de febrero de 2022
- Se libera el modelo de petróleo de luz CNN V4.
17 de enero de 2018
- Se lanzan el modelo Light CNN-29 V2 y el código de entrenamiento. El 100% - EER en LFW logra 99.43% .
- El rendimiento del conjunto 1 en MegaFace logra 76.021% para la precisión de rango-1 y 89.740% para TPR@FAR = 10^-6.
12 de septiembre de 2017
- Se lanzan el modelo ligero CNN-29 y el código de entrenamiento. El 100% - EER en LFW logra 99.40% .
- El rendimiento del conjunto 1 en MegaFace logra 72.704% para la precisión de rango-1 y 85.891% para TPR@FAR = 10^-6.
12 de julio de 2017
- Se lanzan el modelo ligero CNN-9 y el código de entrenamiento. El 100% - EER en LFW obtiene 98.70% .
- El rendimiento del conjunto 1 en MegaFace logra 65.782% para la precisión de rango-1 y 76.288% para TPR@FAR = 10^-6.
4 de julio de 2017
- El repositorio fue construido.

Instalación

Instale Pytorch siguiendo el sitio web.
Clon este repositorio.
- Nota: Actualmente solo lo ejecutamos en Python 2.7.

Conjuntos de datos

Descargue el conjunto de datos de cara como Casia-Webface, VGG-FACE y MS-CELEB-1M.
- La lista de limpieza MS-Celeb-1M está cargada: Baidu Yun, Google Drive.
Todas las imágenes faciales se convierten en imágenes a escala de grises y se normalizan a 144x144 de acuerdo con los puntos de referencia.
Según los cinco puntos faciales, no solo giramos dos puntos de ojos horizontalmente, sino que también establecemos la distancia entre el punto medio de los ojos y el punto medio de la boca (EC_MC_Y), y el eje y del punto medio de los ojos (EC_Y).
Las imágenes LFW alineadas se cargan en Baidu Yun.
Conjunto de datos tamaño EC_MC_Y EC_Y
Set de entrenamiento 144x144 48 48
Conjunto de pruebas 128x128 48 40

Conjunto de datos	tamaño	EC_MC_Y	EC_Y
Set de entrenamiento	144x144	48	48
Conjunto de pruebas	128x128	48	40

Capacitación

Para entrenar la luz CNN usando el script de trenes simplemente especifique los parámetros enumerados en train.py como una bandera o cambiarlos manualmente.

python train.py --root_path=/path/to/your/datasets/ 
		--train_list=/path/to/your/train/list.txt 
		--val_list=/path/to/your/val/list.txt 
		--save_path=/path/to/your/save/path/ 
		--model= " LightCNN-9/LightCNN-29 " --num_classes=n

Consejos:
- Las listas de conjuntos de datos de trenes y Val son seguidos por el formato de Caffe. Los detalles del cargador de datos se muestran en load_imglist.py . O puede usar torchvision.datasets.ImageFolder para cargar sus conjuntos de datos.
- El num_classes denota el número de identidades en su conjunto de datos de capacitación.
- Al entrenar por Pytorch, puede establecer una tasa de aprendizaje más grande que la cafetería y Pytorch la convergue más rápido que Caffe para Light CNN.
- Ampliamos la tasa de aprendizaje para los parámetros de FC2 que pueden llevar un mejor rendimiento. Si la capacitación se colapsan en sus propios conjuntos de datos, puede disminuirlo.
- Modificamos la implementación de SGD con impulso ya que la implementación oficial de Pytorch es diferente de SutsKever ET. Alabama. Los detalles se muestran aquí.
- Los conjuntos de datos de entrenamiento para LightCNN-29V2 son Casia-Webface y MS-Celeb-1M, por lo tanto, el num_classes es 80013 .

Evaluación

Para evaluar una red capacitada:

 python extract_features.py --resume=/path/to/your/model 
			   --root_path=/path/to/your/datasets/ 
			   --img_list=/path/to/your/list.txt 
			   --save_path=/path/to/your/save/path/ 
			   --model="LightCNN-9/LightCNN-29/LightCNN-29v2"
			   --num_classes=n (79077 for LightCNN-9/LightCNN-29, 80013 for LightCNN-29v2)

Puede usar vlfeat o sklearn para evaluar las características en ROC y obtener EER y TPR@FPR para sus conjuntos de datos de prueba.
El modelo de LightCNN-9 se lanza en Google Drive.
- Tenga en cuenta que el modelo liberado contiene todo el estado del módulo CNN de luz y el optimizador. Los detalles del modelo de carga se pueden encontrar en train.py .
El modelo de LightCNN-29 se lanza en Google Drive.
El modelo de LightCNN-29 V2 se lanza en Google Drive.
Se lanzan las características de LFW y MegaFace of LightCnn-9.
El modelo de LightCNN V4 se lanza en Google Drive.
- La estructura detallada de LightCnn V4 se muestra en Light_cnn_v4.py
- La entrada es una imagen de cara alineada de 128*128 bgR .
- El valor del píxel de entrada se normaliza por media ([0.0, 0.0, 0.0]) y STD ([255.0, 255.0, 255.0]).

Actuación

El rendimiento ligero de CNN en LFW 6,000 pares.

Modelo	100% - EER	TPR@FAR = 1%	Tpr@far=0.1%	TPR@FAR = 0
Lightcnn-9	98.70%	98.47%	95.13%	89.53%
Lightcnn-29	99.40%	99.43%	98.67%	95.70%
Lightcnn-29v2	99.43%	99.53%	99.30%	96.77%
Lightcnn v4	99.67%	99.67%	99.57%	99.27%

El rendimiento de la luz de la luz en los protocolos BLUFR LFW

Modelo	Vr@far=0.1%	Dir@Far = 1%
Lightcnn-9	96.80%	83.06%
Lightcnn-29	98.95%	91.33%
Lightcnn-29v2	99.41%	94.43%

El rendimiento ligero de CNN en megaface

Modelo	Rango-1	TPR@FAR = 1E-6
Lightcnn-9	65.782%	76.288%
Lightcnn-29	72.704%	85.891%
Lightcnn-29v2	76.021%	89.740%

Citación

Si usa nuestros modelos, cite el siguiente documento:

 @article{wu2018light,
  title={A light CNN for deep face representation with noisy labels},
  author={Wu, Xiang and He, Ran and Sun, Zhenan and Tan, Tieniu},
  journal={IEEE Transactions on Information Forensics and Security},
  volume={13},
  number={11},
  pages={2884--2896},
  year={2018},
  publisher={IEEE}
}