Глубокое обучение для распознавания объектов FreeHand
В этом проекте мы предлагаем новую архитектуру глубокого обучения, которая достигает современных результатов в распознавании объектов свободного эскиза. Очень знаковая и абстрактная природа объектов эскиза делает задачей для компьютерного алгоритма их распознавать. Поскольку распознавание эскизов не является новой концепцией в компьютерном зрении, мы провели подробное исследование предыдущих работ, связанных с нашим доменом проекта. Модели ручной работы не смогли запечатлеть культовую природу эскизов. И существующие архитектуры глубокого обучения адаптированы к фотоизображениям и не применяются к различным уровням абстракции, присутствующих в объектах эскиза. Это привело к тому, что Sketch-A-Net превзошел точность уровня человека. Sketch-A-Net требует информации о заказе удара, чтобы точно распознать объекты Sketch. Структура рассматривает только входы эскиза в реальном времени и не может обрабатывать большой набор данных эскизов, доступных в Интернете. Все вышеупомянутые исследования в области исследований поврежденно подчеркнули принять новую архитектуру глубокого обучения, которая адаптирована для решения распознавания эскизов.
Наша модель спроектирована на принципе Хеббиян, в котором говорится, что нейроны, которые связаны вместе, активируются вместе. Мы решаем общие проблемы, которые упускаются в предыдущих работах, касающихся нового дизайна модели глубокого обучения. Мы решаем переосмысление проблем с более широкой сетью, введя в нашу модель редкую структуру сверточных блоков. Мы разработали модель для решения эскиза объекта, знаменитой и абстрактной природой, используя большое количество тренировочных образцов. Наша модель обучена набору данных Tu-Berlin Sketch, который состоит из 20 000 объектов из 250 категорий. Мы применяем методы данных-аугментации на наборе данных, чтобы упруго увеличить его размер. Наша модель достигает точность распознавания новаторского распознавания 84,7%, что на 10% больше, чем ее предшественники. Затем мы развернули нашу модель на облачной платформе и настроили веб-приложение для обработки запросов распознавания эскизов. Несмотря на то, что наша модель достигает высокой точности, она все еще не может распознать деформации внутриклассов. Это указывает на то, что у нашей модели все еще есть место для улучшения.
Успешное решение распознавания эскизов, мы теперь можем перейти к решению распознавания с несколькими объектами, сегментацией объектов эскиза, поиску изображений на основе запроса эскиза и наиболее популярной тенденции текущего вида, использование генеративных состязательных сетей для синтеза эскиза объектов или использования объекта эскиза для синтеза полного фотоистичного изображения. Возможности в этом домене бесконечны, и мы планируем посетить и продолжать наши исследования в области глубокого обучения для объектов бесплатного эскиза в будущем.
Войдите в кластер GPU и поместите файлы заданий Condor в вашу публику.
Чтобы запустить задание Condor, используйте следующую команду:
condor_submit sketch.sub
cat sketch.out
cat sketch.log
cat skecth.error
condor_q # get job ID
kill job_id
Перейдите в папку веб -приложений и откройте терминал и выполните приведенный ниже код:
python manage.py runserver
Чтобы настроить публичный IP для приложения Django, мы открываем NGROK и преодолеваем следующую команду для соответствующего номера порта (номер порта приложения):
ngrok port_number
[1] C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke и A. Rabinovich, «Пойдя глубже с свержениями», конференция IEEE по компьютерному зрению и распознаванию моделей (CVPR), с. 1-9, 2015.
[2] R. Hua и J. Collomosse, «Оценка производительности дескриптора Hog Hever градиента для на основе эскизов», компьютерное зрение и понимание изображения, Vol. Том 117, нет. 7, с. 790-806, 2013.
[3] S. Ouyang, T. Hospedales, Y.-Z. Song и X. Li, «Кросс-модальное соответствие лица: за пределами просмотра эскизов», Computer Vision-ACCV 2014, Vol. 9004, с. 210-225, 2014.
[4] RG Schneider и T. Tuytelaars, «Классификация эскизов и анализ классификации с использованием векторов Fisher», Tog Acm Trans. График Транзакции ACM на графике, стр. 1-9, 2014.
[5] Y. Lecun, L. Bottou, Y. Bengio и P. Haffner, «Обучение на основе градиента, применяемое к распознаванию документов», Torkings of the Ieee, Vol. 86, нет. 11, с. 2278-2324, 1998.
[6] Ю, Ян, Сонг, Сян и Госпиталы, «Sketch-a-Net, который побеждает людей», процедуры Британской конференции по машинному видению 2015, 2015.
[7] L. T, T. C, S. F и C. S, Новая модель распознавания для, 2015.
[8] J. G, G. MD, H. J и Y.-LD E, Вычислительная поддержка для набросков в дизайне A Обзор. Фонд и тенденции в взаимодействии человека с компьютером, 2009 год.
[9] J. MFA, R. MSM, O. NZS и J. Z, «Сравнительное исследование метода экстракции и распознавания данных САПР из чертежей CAD», в Международной конференции по управлению информацией и инженерией, 2009.
[10] Эйц М. А. Хейс, Дж. А. Алекса и Марк, «Как люди эскиз эскиз?», ACM Trans. График (Proc. Siggraph), Vol. 31, нет. 4, с. 44: 1--44: 10, 2012.
[11] R. Galiazzi Schneider и T. Tuytelaars, «Классификация и анализ классификации и классификацию с использованием векторов Fisher», «Труды Siggraph Asia 2014», вып. 33, нет. 6, с. 1-9, 2014.
[12] Z. Sun, C. Wang, L. Zhang и L. Zhang, «Бесплатная сегментация эскизов», Microsoft Research Asia, Пекин, 2012.
[13] А. Крижевский, И. Сатскевер и Ге Хинтон, «Классификация ImageNet с глубокими сверточными нейронными сетями», в «Достижениях в системах обработки нейронной информации», 2012.
[14] А. Крижевский, И. Сатскевер и Ге Хинтон, «ImageNetClassiationWitchationWithDeepConvolutional NeuralNetworks», Конференция по системам обработки нейронной информации (NIPS), 2012.
[15] C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhoucke и A. Rabinovich, «BowdeeperwithConvolutions», компьютерное зрение и распознавание паттерна, 2015.
[16] К. Симонян и А. Зиссерман, «Очень глубокие сверточные сети для крупномасштабного распознавания изображений», Международная конференция по обучению, 2015.
[17] C. Szegedy, W. Liu, Y. Jia, P. Sermanet, S. Reed, D. Anguelov, D. Erhan, V. Vanhouck и A. Rabinovich, «углубляясь в контуляции», CVPR, 2015.
[18] М.-М. Полем Poo и R. Fitzsimonds, «Ретроградная передача сигналов в разработке и модификации синапсов», Psychological Reviews, vol. , нет. , с. ,
[19] S. Arora, A. Bhaskara, R. GE и T. MA, «Довольно BoundsForleSomedeepResentations», Corr, 2013.
[20] DP Kingma и J. BA, «Адам: метод стохастической оптимизации», в 3 -й Международной конференции для обучения, Сан -Диего, 2015.
[21] L. Fei-Fei, J. Deng и K. Li, «ImageNet: создание крупномасштабной базы данных изображений», Journal of Vision, Vol. 9, нет. 8, с. 1037-1037, 2010.
[22] P. Доллар, «Быстрое обнаружение края с использованием структурированных лесов», IEEE Transactions по анализу шаблонов и машинного интеллекта, вып. 37, нет. 8, с. 1558-1570, 2015.
[23] Распределение программного обеспечения Anaconda, компьютерное программное обеспечение. Версии 2-2.4.0. Continuum Analytics, 2016. [24] F. Chollet, Keras, url {https://github.com/fchollet/keras}, 2015.
[25] GE Krasner и ST POPE, «Поваренная книга для использования парадигмы пользовательского интерфейса модели-просмотра в SmallTalk-80», The Journal of Object Technology, vol. , нет. , с. ,
[26] DL Parnas и PC Clements, «Рациональный процесс проектирования: как и зачем ее подделать», Программное обеспечение, IEEE Transactions, Vol. , нет. , с. 251–257 ,.
[27] Jdonahue, Jiayq, Vinynals, Jhoffman, Nzhang, Etzeng and Trevor, «Кофе без кофеината: функция глубокой сверточной активации», 2013.
[28] Р. Гиршик, Дж. Донахью, Т. Даррелл и Дж. Малик, «Иерархии богатых функций для точного обнаружения объектов и семантической сегментации», Tech Report, UC Berkely, Berkely, 2014.
[29] J. Uijlings, «Избирательный поиск распознавания объектов», IJCV, Нидерланды, 2012.
[30] «Глобальная инфраструктура» ,. [Онлайн]. Доступно: https://aws.amazon.com/about-aws/global-infrastructure/. [Доступ 1 4 2017].
[31] М. а. HJ a. Я eitz, «как люди наброски объектов?», ACM Trans. График (Proc. Siggraph), Vol. 31, нет. 4, с. 44: 1--44: 10, 2012.
[32] Y.. Lecun, "Lenet-5, сверточные нейронные сети" ,. [Онлайн]. Доступно: http://yann.lecun.com/exdb/lenet/. [Доступ 2 4 2017].
[33] H. Li Y, S. TM и GS Y, «Распознавание эскизов FreeHand Multi-Kernel», CVIU, 2015.
[34] S. Li Y и GS Y, «Распознавание эскизов с помощью ансамблевого соответствия структурированных функций», BMVC, 2013.