Uma equipe de pesquisadores da Universidade de Surrey e da Universidade de Stanford, no Reino Unido, alcançou um avanço no campo da inteligência artificial: eles desenvolveram um novo método que permite à inteligência artificial compreender esboços de desenhos desenhados por humanos, mesmo que esses esboços fossem feito por não especialistas em. Este resultado de pesquisa permite que a inteligência artificial alcance uma precisão quase humana na identificação de esboços de cenas, estabelecendo as bases para uma interação humano-computador mais poderosa e fluxos de trabalho de design mais eficientes. Este avanço tecnológico não se reflete apenas no reconhecimento de objetos no esboço, mas, mais importante, na capacidade de compreender o significado de cada traço no esboço, o que fornece novas ideias para a inteligência artificial compreender a expressão visual humana.
Uma equipe de pesquisadores da Universidade de Surrey e da Universidade de Stanford, no Reino Unido, desenvolveu um novo método para ensinar inteligência artificial (IA) a compreender esboços de desenhos de linhas humanas, mesmo quando desenhados por não-artistas. O modelo aborda o desempenho de nível humano no reconhecimento de esboços de cenas.

Yulia Gryaditskaya, professora do Centro de Visão, Fala e Processamento de Sinais (CVSSP) da Universidade de Surrey e do Instituto Central de Inteligência Artificial (PAI) do Povo de Surrey, disse: "O esboço é uma linguagem de comunicação visual poderosa. Às vezes é ainda mais poderoso do que linguagem falada. Expressivo e flexível O desenvolvimento de ferramentas para compreender os esboços é um passo em direção a uma interação humano-computador mais poderosa e a fluxos de trabalho de design mais eficientes. Independentemente da idade e da origem, as pessoas usam o desenho para explorar novas ideias e comunicar. No entanto, os sistemas de IA sempre tiveram problemas para entender os esboços. A IA deve aprender a compreender as imagens. Normalmente, isso requer um processo demorado e trabalhoso de coleta de rótulos para cada pixel da imagem. A IA então aprende com esses rótulos.
No entanto, a equipe de pesquisa ensinou IA por meio de uma combinação de esboços e descrições escritas. Aprendeu a agrupar pixels, combinando-os com categorias na descrição. Como resultado, a IA está a demonstrar uma compreensão humana mais rica e próxima do que nunca. Ele foi capaz de identificar e marcar corretamente pipas, árvores, girafas e outros objetos com 85% de precisão, superando outros modelos que dependiam de pixels marcados. Além de identificar objetos em cenas complexas, ele também pode determinar qual objeto cada traço é usado para representar. Este novo método funciona não apenas para esboços informais feitos por não-artistas, mas também para esboços feitos por sujeitos sem formação explícita.
Judith Fan, professora assistente de psicologia na Universidade de Stanford, disse: "Desenhar e escrever estão entre as atividades humanas mais essenciais e têm sido usados há muito tempo para capturar as observações e pensamentos das pessoas. Este trabalho é um passo importante na capacidade dos sistemas de IA de compreender a natureza das ideias que as pessoas estão tentando transmitir. Foi feito um progresso emocionante, quer usem imagens ou texto.” A pesquisa foi conduzida como parte do Centro Popular de Inteligência Artificial da Universidade de Surrey, especificamente sua iniciativa SketchX. SketchX utiliza inteligência artificial para tentar compreender a forma como vemos o mundo através da forma como desenhamos.
O professor Song Yizhe, codiretor do Instituto de Inteligência Artificial do People's Center e chefe do SketchX, disse:"Esta pesquisa é um excelente exemplo de como a IA pode melhorar as atividades humanas básicas, como o esboço. Ao compreender esboços aproximados. precisão humana, esta tecnologia tem um enorme potencial para melhorar a criatividade natural das pessoas, independentemente do talento artístico.”
Endereço do artigo: https://arxiv.org/abs/2312.12463
O resultado desta pesquisa trouxe novos avanços para a inteligência artificial nas áreas de compreensão de imagens e interação humano-computador. Espera-se que seja amplamente utilizado em design, criação artística e outros campos no futuro, promovendo ainda mais o desenvolvimento colaborativo de humanos e artificiais. inteligência. Os avanços nesta tecnologia também demonstram o enorme potencial da inteligência artificial na compreensão de informações humanas não estruturadas.