徒手素描對象識別的深度學習
在這個項目中,我們提出了一種新穎的深度學習體系結構,可以實現最先進的素描對象識別。草圖對象的高度標誌性和抽象的性質使計算機算法很難識別它們。由於草圖識別不是計算機視覺中的新概念,因此我們對與我們的項目域相關的先前作品進行了詳細的研究。手工製作的模型未能捕獲草圖的標誌性性質。並且現有的深度學習體系結構是針對照片圖像量身定制的,並且不採用草圖對像中存在的抽象級別。這導致了素描-A-net超過人類水平的準確性。 Sketch-a-net需要筆劃訂單信息以準確識別草圖對象。該框架僅考慮實時草圖輸入,並且無法處理在線可用的大量素描對像數據集。上述所有研究發現,都強調採用一種新的深度學習架構,該建築量身定制以解決素描識別。
我們的模型是根據Hebbian原理設計的,該原理指出,耦合在一起並激活的神經元。我們解決了有關新的深度學習模型設計中以前著作中忽略的常見問題。我們通過在模型中引入卷積塊的稀疏結構來解決更廣泛網絡的過度問題。我們通過使用大量訓練樣本來設計模型來求解素描對象標誌性和抽象性質。我們的模型經過Tu-Berlin Sketch Datat的培訓,該數據集由250個類別的20,000個對象組成。我們在數據集上應用數據提陞技術以彈性增加其大小。我們的模型達到了84.7%的突破性識別精度,比其前身高約10%。然後,我們將模型部署在雲平台上,並設置Web應用程序來處理草圖識別請求。即使我們的模型達到了很高的精度,但它仍然無法識別階層內變形。這指出我們的模型仍然有改進的餘地。
通過成功求解草圖識別,我們現在可以朝著求解多對象識別,草圖對象分割,基於草圖查詢的圖像檢索以及計算機視覺中最流行的當前趨勢,使用生成的對抗網絡來合成素描對像或使用素描對象將素描對像用於綜合圖像。該領域的可能性是無窮無盡的,我們計劃將來訪問並繼續進行深度學習的研究。
登錄到GPU群集,並將禿鷹作業文件放在您的公共福特爾中。
要運行禿鷹作業,請使用以下命令:
condor_submit sketch.sub
cat sketch.out
cat sketch.log
cat skecth.error
condor_q # get job ID
kill job_id
導航到Web應用程序文件夾並打開終端並執行以下代碼:
python manage.py runserver
要為Django應用程序設置公共IP,我們打開NGrok並啟用以下端口號的命令(應用程序特定端口號):
ngrok port_number
[1] C. Szegedy,W。 Liu,Y。 Jia,P。 Sermanet,S。 Reed,D。 Anguelov,D。 Erhan,V。 Vanhoucke和A. Rabinovich,“隨著IEEE的計算機視覺和圖案識別(CVPR),第1-9頁,2015年的IEEE卷積會議。
[2] R. Hua和J. Collomosse,“基於草圖的梯度野豬描述符的性能評估”,《計算機視覺和圖像理解》,第1卷。第117卷,沒有。 7,第790-806頁,2013年。
[3] S. Ouyang,T。 Hospedales,Y.-Z. Song and X. Li,“跨模式的面部匹配:超越查看的草圖”,《計算機視覺》 - ACCV 2014,第1卷。 9004,第210-225頁,2014年。
[4] RG Schneider和T. Tuytelaars,“使用Fisher向量的草圖分類和分類驅動的分析”,Tog Acm Trans。圖形。圖形上的ACM交易,第1-9頁,2014年。
[5] Y. Lecun,L。 Bottou,Y。 Bengio和P. Haffner,“基於梯度的學習應用於文檔識別”,《 IEEE的論文集》,第1卷。 86,不。 11,第2278-2324頁,1998年。
[6] Yu,Yang,Song,Xiang和Hospedales,“擊敗人類的Sketch-a-a-net”,2015年英國機器視覺會議的程序。
[7] L. T,T。 C,S。 F和C. S,2015年的新識別模型。
[8] J. G. G. Md,H。 J和Y.-LD E,設計審查中素描的計算支持。人類計算機相互作用的基礎和趨勢,2009年。
[9] J. MFA,R。 MSM,O。 NZS和J. Z,“從CAD圖中提取和識別方法的比較研究。”在國際信息管理與工程會議上,2009年。
[10] Eitz,M。 Hays,J。 Alexa和Marc,“人類如何繪製對象?” ACM Trans。圖形。 (Proc。Siggraph),第1卷。 31,沒有。 4,第44:1--44:10,2012。
[11] R. Galiazzi Schneider和T. Tuytelaars,“使用Fisher Vectors的草圖分類和分類驅動的分析”,《 Siggraph Asia Asia 2014,2014年》,第1卷。 33,不。 6,第1-9頁,2014年。
[12] Z. Sun,C。 Wang,L。 Zhang和L.
[13] A. Krizhevsky,I。 Sutskever和Ge Hinton,“具有深卷積神經網絡的Imagenet分類”,在神經信息處理系統的進步中,2012年。
[14] A. Krizhevsky,I。 Sutskever和Ge Hinton,“ ImagenetClassifientationWithDeepConconconconconconvolutional Neurnetworks”,《神經信息處理系統會議》(NIPS),2012年。
[15] C. Szegedy,W。 Liu,Y。 Jia,P。 Sermanet,S。 Reed,D。 Anguelov,D。 Erhan,V。 V.V. Vanhoucke和A. Rabinovich,“ GoingDeeperWithConvolutions,“ Computer Wision and Patteren necention”,2015年。
[16] K. Simonyan和A. Zisserman,“大規模圖像識別的非常深的捲積網絡”,2015年國際學習表現會議。
[17] C. Szegedy,W。 Liu,Y。 Jia,P。 Sermanet,S。 Reed,D。 Anguelov,D。 Erhan,V。 V。 Vanhouck和A. Rabinovich,“隨著卷積而深入,” CVPR,2015年。
[18] M.-M。 。便便和R. Fitzsimonds,“突觸的發展和修飾中的逆行信號”,《心理評論》,第1卷。 , 不。 ,p。 ,。
[19] S. Arora,A。 Bhaskara,R。 Ge和T. Ma,“ Propablesboundsforlearningsomedeeppresentations”,Corr,2013年。
[20] DP Kingma和J. Ba,“亞當:隨機優化的方法”,在第三屆國際學習代表會議上,聖地亞哥,2015年。
[21] L. Fei-Fei,J。 Deng和K. Li,“ Imagenet:構建大型圖像數據庫”,《 Vision Journal》,第1卷。 9,不。 8,第1037-1037頁,2010年。
[22] P. Dollar,“使用結構化森林的快速邊緣檢測”,《圖案分析與機器智能的IEEE交易》,第1卷。 37,不。 8,第1558-1570頁,2015年。
[23] Anaconda軟件發行,計算機軟件。 Vers。 2-2.4.0。 Continuum Analytics,2016年。 [24] F. Chollet,Keras, url {https://github.com/fchollet/keras},2015年。
[25] GE Krasner和St Pope,“用於使用SmallTalk-80中的模型視圖控制器用戶界面範式的食譜”,《 Object Technology Journal》,第1卷。 , 不。 ,p。 ,。
[26] DL Parnas和PC Clements,“合理的設計過程:如何偽造它”,軟件工程,IEEE Transactions,第1卷。 , 不。 ,p。 251–257,。
[27] Jdonahue,Jiayq,Vinyals,Jhoffman,Nzhang,Etzeng和Trevor,“ Decaf:深層卷積激活功能”,2013年。
[28] R. Girshick,J。 Donahue,T。 Darrell和J. Malik,“豐富的特色層次結構,用於準確的對象檢測和語義細分”,Tech Report,UC Berkely,Berkely,2014年。
[29] J. Uijlings,“選擇性搜索對象識別”,IJCV,荷蘭,2012年。
[30]“全球基礎架構”,。 [在線的]。可用:https://aws.amazon.com/about-aws/global-infrastructure/。 [2017年訪問1 4]。
[31] M. a。 HJ a。 Am Eitz,“人類如何繪製對象?”,ACM Trans。圖形。 (Proc。Siggraph),第1卷。 31,沒有。 4,第44:1--44:10,2012。
[32] y。 Lecun,“ Lenet-5,卷積神經網絡”,。 [在線的]。可用:http://yann.lecun.com/exdb/lenet/。 [2017年訪問2 4]。
[33] H. Li Y,S。 TM和GS Y,“多內核學習的徒手素描識別”,CVIU,2015年。
[34] S. Li Y和GS Y,“結構化特徵的集合匹配的草圖識別”,BMVC,2013年。