Классификатор шрифта
Этот репозиторий содержит эксперименты для шрифтов в классе с изображений. В настоящее время он состоит из скребков для получения данных.
Требования
Как установить
virtualenv -p /usr/bin/python3 venvsource venv/bin/activatepip install -r requirements.txtexport PYTHONPATH=.Пакет Fontastic содержит следующую структуру папок:
fontastic --
scrape
utils
Загрузите шрифты и не растеряйте его в местоположении <project_root> . Таким образом, каждый шрифт будет списком, как ниже
project_root/data/src/fonts/roboto
project_root/data/src/fonts/roboto/roboto-regular.ttf
project_root/data/src/fonts/roboto/roboto-bold.ttf
project_root/data/src/fonts/roboto/roboto-italic.ttf
project_root/data/src/fonts/open-sans
project_root/data/src/fonts/open-sans/open-sans-regular.ttf
project_root/data/src/fonts/open-sans/open-sans-regular.ttf
project_root/data/src/fonts/open-sans/open-sans-regular.ttf
...
...
...
Теперь запустите python fontastic/data_generation/local_image_gen.py
Программа создаст 4K -изображения для каждого случайного текста и комбинации TTF. Расположение выходного изображения - project_root/data/dst/roboto/<output_images>
Затем запустите python fontastic/data_generation/training_data_gen.py . Эта программа создаст культуры изображения и выполнит преобразования данных, которые можно использовать для обучения сети.
Мыслительный процесс, лежащий в основе обучения и оценки, состоит в том, чтобы запустить каждый из них в качестве эксперимента с определенными артефактами, связанными с экспериментом. Это дает нам следующие преимущества:
Пожалуйста, посмотрите на раздел TRAIN_TEST_SPLIT в config.ini , чтобы понять конфигурации, необходимые для запуска эксперимента и создания данных тестирования и поезда.
Команда для использования - это:
python fontastic/data_generation/train_test_split.py --config fontastic/data_generation/config.ini
Это генерирует experiments folder с experiment_id в качестве подпапки для хранения артефактов. В случае, если experiment_id остается пустым в конфигурации во время первого запуска, это будет заполнено и записано обратно в конфигурацию.
Вы должны увидеть CSV для train и test соответственно в папке Path Path.
Пожалуйста, используйте этот Zip, чтобы получить 70 шрифтов для обучения модели