Cohere ha logrado un gran avance en el modelo de búsqueda Embed3, logrando una integración perfecta de la búsqueda de imágenes y la recuperación de texto. El editor de Downcodes se enteró de que esta innovación unifica la búsqueda de imágenes y texto en una base de datos, cambiando por completo la forma en que las empresas administran imágenes masivas de productos, diseñan documentos e informes, y mejoran en gran medida la eficiencia y conveniencia de la búsqueda. Este movimiento trae cambios revolucionarios a la gestión de datos empresariales y también marca un paso clave para la tecnología de búsqueda multimodal en aplicaciones de nivel empresarial.
Cohere logró recientemente un gran avance en su modelo de búsqueda Embed3, integrando perfectamente la funcionalidad de búsqueda de imágenes con la recuperación de texto por primera vez. Esta innovación permite a las empresas lograr una búsqueda unificada de imágenes y texto en la misma base de datos, aportando cambios revolucionarios a la gestión de imágenes masivas de productos, documentos de diseño e informes.
A nivel técnico, el nuevo sistema adopta una arquitectura de almacenamiento unificada, que resuelve por completo el problema de las empresas que necesitan mantener múltiples bases de datos independientes. El sistema admite formatos de imagen convencionales como PNG, JPEG, WebP y GIF, y el límite superior de tamaño de archivo único es 5 MB. Actualmente, el sistema solo admite consultas de una sola imagen y la función de procesamiento por lotes aún está en desarrollo.

Con el apoyo de la tecnología central, el sistema convierte los datos comerciales en representación vectorial, lo que mejora en gran medida la eficiencia de recuperación de datos comerciales complejos. Los desarrolladores pueden acceder a las nuevas funciones a través de la API Embed existente y las imágenes deben enviarse como URL de datos codificadas en Base64.
Vale la pena mencionar que el modelo actualizado admite más de 100 idiomas y tiene una sólida compatibilidad multiplataforma. Además de ejecutarse en la propia plataforma de Cohere, también se puede implementar en Microsoft Azure y Amazon SageMaker. Esta empresa, fundada por el equipo de I+D de arquitectura Transformer, recibió 500 millones de dólares en apoyo financiero en julio del año pasado.
En un contexto de creciente importancia de la búsqueda de contenidos multimodal, gigantes tecnológicos como Google y OpenAI también han lanzado productos similares. El enfoque competitivo actual se ha desplazado hacia la velocidad de procesamiento, la precisión y la seguridad necesarias para las aplicaciones de clase empresarial.
El avance de Cohere no sólo mejora la eficiencia de la recuperación de datos, sino que también proporciona una nueva dirección para el desarrollo futuro de la tecnología de búsqueda multimodal. Creo que en un futuro próximo veremos más innovaciones similares aplicadas en diversos campos, promoviendo aún más el avance de la tecnología de recuperación de información. El editor de Downcodes seguirá prestando atención al desarrollo de tecnologías relacionadas y brindará más información de vanguardia a los lectores.