Classificador de fonte
Este repositório contém experimentos para classificar fontes de imagens. Atualmente, consiste em raspadores para puxar os dados.
Requisitos
Como instalar
virtualenv -p /usr/bin/python3 venvsource venv/bin/activatepip install -r requirements.txtexport PYTHONPATH=.O pacote fontástico contém a seguinte estrutura de pastas:
fontastic --
scrape
utils
Faça o download de fontes e upar no local <project_root> . Então, toda fonte estará listada como abaixo
project_root/data/src/fonts/roboto
project_root/data/src/fonts/roboto/roboto-regular.ttf
project_root/data/src/fonts/roboto/roboto-bold.ttf
project_root/data/src/fonts/roboto/roboto-italic.ttf
project_root/data/src/fonts/open-sans
project_root/data/src/fonts/open-sans/open-sans-regular.ttf
project_root/data/src/fonts/open-sans/open-sans-regular.ttf
project_root/data/src/fonts/open-sans/open-sans-regular.ttf
...
...
...
Agora execute python fontastic/data_generation/local_image_gen.py
O programa criará imagens 4K para cada combinação aleatória de texto e TTF. A localização da imagem de saída é project_root/data/dst/roboto/<output_images>
Em seguida, execute python fontastic/data_generation/training_data_gen.py . Este programa criará culturas da imagem e executará transformações de dados que podem ser usadas para treinar a rede.
O processo de pensamento por trás do treinamento e avaliação é executar cada um como um experimento com certos artefatos associados ao experimento. Isso nos dá os seguintes benefícios:
Consulte a seção TRAIN_TEST_SPLIT no config.ini para entender as configurações necessárias para iniciar um experimento e gerar dados de teste e treinamento.
O comando a ser usado é:
python fontastic/data_generation/train_test_split.py --config fontastic/data_generation/config.ini
Isso gerará uma experiments folder com o experiment_id como sub -pasta para armazenar os artefatos. Caso o experiment_id seja deixado vazio na configuração durante a primeira execução, isso será preenchido e escrito de volta à configuração.
Você deve ver um CSV para train e test respectivamente, na pasta Path Experiments.
Por favor, use este zip para obter as 70 fontes para treinar o modelo