Un equipo de investigadores de la Universidad de Surrey y la Universidad de Stanford en el Reino Unido ha logrado un gran avance en el campo de la inteligencia artificial: han desarrollado un nuevo método que permite a la inteligencia artificial comprender bocetos lineales dibujados por humanos, incluso si estos bocetos fueron realizado por no expertos en. El resultado de esta investigación permite que la inteligencia artificial alcance una precisión cercana al nivel humano en la identificación de bocetos de escenas, sentando las bases para una interacción persona-computadora más poderosa y flujos de trabajo de diseño más eficientes. Este avance tecnológico no solo se refleja en el reconocimiento de objetos en el boceto, sino más importante aún, en la capacidad de comprender el significado de cada trazo en el boceto, lo que proporciona nuevas ideas para que la inteligencia artificial comprenda la expresión visual humana.
Un equipo de investigadores de la Universidad de Surrey y la Universidad de Stanford en el Reino Unido ha desarrollado un nuevo método para enseñar a la inteligencia artificial (IA) a comprender los bocetos de líneas humanas, incluso cuando los dibujan personas que no son artistas. El modelo se acerca al rendimiento a nivel humano en el reconocimiento de bocetos de escenas.

La Dra. Yulia Gryaditskaya, profesora del Centro de Procesamiento de Visión, Habla y Señales (CVSSP) de la Universidad de Surrey y del Instituto Central de Inteligencia Artificial (PAI) del Pueblo de Surrey, dijo: "Dibujar es un poderoso lenguaje de comunicación visual. A veces es incluso más poderoso que Lenguaje hablado expresivo y flexible. Desarrollar herramientas para comprender bocetos es un paso hacia una interacción persona-computadora más poderosa y flujos de trabajo de diseño más eficientes. Independientemente de la edad y los antecedentes, las personas utilizan el dibujo para explorar nuevas ideas y comunicarse. Sin embargo, los sistemas de IA siempre han tenido problemas para comprender los bocetos. La IA debe aprender a comprender las imágenes. Normalmente, esto requiere un proceso laborioso y que requiere mucho tiempo para recopilar etiquetas para cada píxel de la imagen. Luego, la IA aprende de estas etiquetas.
Sin embargo, el equipo de investigación enseñó a la IA mediante una combinación de bocetos y descripciones escritas. Aprendió a agrupar píxeles, relacionándolos con categorías en la descripción. Como resultado, la IA está demostrando una comprensión humana más rica y cercana que nunca. Pudo identificar y etiquetar correctamente cometas, árboles, jirafas y otros objetos con un 85% de precisión, superando a otros modelos que se basaban en píxeles etiquetados. Además de identificar objetos en escenas complejas, también puede determinar qué objeto se utiliza para representar cada trazo. Este nuevo método funciona no sólo para bocetos informales realizados por no artistas, sino también para bocetos realizados por sujetos sin una formación explícita.
Judith Fan, profesora asistente de psicología en la Universidad de Stanford, dijo: "El dibujo y la escritura se encuentran entre las actividades humanas por excelencia y se han utilizado durante mucho tiempo para capturar las observaciones y pensamientos de las personas. Este trabajo es un importante paso adelante en la capacidad de los sistemas de inteligencia artificial para comprender La naturaleza de las ideas que la gente intenta transmitir. Se han logrado avances emocionantes, ya sea que utilicen imágenes o texto ". La investigación se llevó a cabo como parte del Centro Popular para el Instituto de Inteligencia Artificial de la Universidad de Surrey, específicamente su iniciativa SketchX. SketchX utiliza inteligencia artificial para intentar comprender la forma en que vemos el mundo a través de la forma en que dibujamos.
El profesor Song Yizhe, codirector del Instituto de Inteligencia Artificial del People's Center y director de SketchX, dijo: "Esta investigación es un excelente ejemplo de cómo la IA puede mejorar las actividades humanas básicas como dibujar. Al comprender bocetos aproximados con casi precisión humana, esta tecnología tiene un enorme potencial para mejorar la creatividad natural de las personas, independientemente del talento artístico”.
Dirección del artículo: https://arxiv.org/abs/2312.12463
El resultado de esta investigación ha aportado nuevos avances a la inteligencia artificial en los campos de la comprensión de imágenes y la interacción persona-computadora. Se espera que en el futuro se utilice ampliamente en el diseño, la creación artística y otros campos, promoviendo aún más el desarrollo colaborativo de humanos y artificiales. inteligencia. Los avances en esta tecnología también demuestran el enorme potencial de la inteligencia artificial para comprender la información humana no estructurada.