Clasificador de fuente
Este repositorio contiene experimentos para las fuentes de clasificación de las imágenes. Actualmente consiste en raspadores para extraer los datos.
Requisitos
Cómo instalar
virtualenv -p /usr/bin/python3 venvsource venv/bin/activatepip install -r requirements.txtexport PYTHONPATH=.El paquete de fontaste contiene la siguiente estructura de carpeta:
fontastic --
scrape
utils
Descargue las fuentes y desencadenelo en la ubicación <project_root> . Entonces, cada fuente se listará a continuación
project_root/data/src/fonts/roboto
project_root/data/src/fonts/roboto/roboto-regular.ttf
project_root/data/src/fonts/roboto/roboto-bold.ttf
project_root/data/src/fonts/roboto/roboto-italic.ttf
project_root/data/src/fonts/open-sans
project_root/data/src/fonts/open-sans/open-sans-regular.ttf
project_root/data/src/fonts/open-sans/open-sans-regular.ttf
project_root/data/src/fonts/open-sans/open-sans-regular.ttf
...
...
...
Ahora ejecute python fontastic/data_generation/local_image_gen.py
El programa creará imágenes 4K para cada texto aleatorio y combinación TTF. La ubicación de la imagen de salida es project_root/data/dst/roboto/<output_images>
SIGUIENTE Ejecute python fontastic/data_generation/training_data_gen.py . Este programa creará cultivos de la imagen y realizará transformaciones de datos que se pueden utilizar para capacitar a la red.
El proceso de pensamiento detrás del entrenamiento y la evaluación es ejecutar cada uno de él como un experimento con ciertos artefactos asociados al experimento. Esto nos da los siguientes beneficios:
Mire la sección TRAIN_TEST_SPLIT en config.ini para comprender las configuraciones requeridas para comenzar un experimento y generar datos de prueba y trenes.
El comando para usar es:
python fontastic/data_generation/train_test_split.py --config fontastic/data_generation/config.ini
Esto generará una experiments folder con el experiment_id como subpodeta para almacenar los artefactos. En caso de que el experiment_id quede vacío en la configuración durante la primera ejecución, esto se poblará y se volverá a escribir a la configuración.
Debería ver un CSV para train y test respectivamente en la carpeta de la ruta de experimentos.
Utilice este zip para obtener las 70 fuentes para entrenar el modelo