Cohere fez um grande avanço no modelo de pesquisa Embed3, alcançando integração perfeita entre pesquisa de imagens e recuperação de texto. O editor do Downcodes aprendeu que essa inovação unifica a pesquisa de imagens e texto em um banco de dados, mudando completamente a maneira como as empresas gerenciam imagens massivas de produtos, projetam documentos e relatórios e melhoram significativamente a eficiência e a conveniência da pesquisa. Esta mudança traz mudanças revolucionárias ao gerenciamento de dados empresariais e também marca um passo fundamental para a tecnologia de pesquisa multimodal em aplicações de nível empresarial.
A Cohere alcançou recentemente um grande avanço em seu modelo de pesquisa Embed3, integrando perfeitamente a funcionalidade de pesquisa de imagens com recuperação de texto pela primeira vez. Esta inovação permite às empresas alcançar uma pesquisa unificada de imagens e texto na mesma base de dados, trazendo mudanças revolucionárias à gestão de imagens massivas de produtos, documentos de design e relatórios.
No nível técnico, o novo sistema adota uma arquitetura de armazenamento unificada, que resolve completamente o problema das empresas que precisam manter vários bancos de dados independentes. O sistema suporta formatos de imagem convencionais, como PNG, JPEG, WebP e GIF, e o limite superior do tamanho de arquivo único é de 5 MB. Atualmente, o sistema suporta apenas consulta de imagem única e a função de processamento em lote ainda está em desenvolvimento.

Com o suporte da tecnologia principal, o sistema converte dados empresariais em representação vetorial, melhorando significativamente a eficiência de recuperação de dados empresariais complexos. Os desenvolvedores podem acessar os novos recursos por meio da API Embed existente, e as imagens devem ser enviadas como URLs de dados codificados em Base64.
Vale ressaltar que o modelo atualizado suporta mais de 100 idiomas e possui forte compatibilidade entre plataformas. Além de rodar na plataforma própria da Cohere, também pode ser implantado no Microsoft Azure e no Amazon SageMaker. Esta empresa, fundada pela equipe de P&D da arquitetura Transformer, recebeu US$ 500 milhões em apoio financeiro em julho do ano passado.
No contexto da crescente importância da pesquisa de conteúdo multimodal, gigantes da tecnologia como Google e OpenAI também lançaram produtos semelhantes. O foco competitivo atual mudou para a velocidade de processamento, precisão e segurança necessárias para aplicações de classe empresarial.
A inovação da Cohere não apenas melhora a eficiência da recuperação de dados, mas também fornece uma nova direção para o desenvolvimento futuro da tecnologia de pesquisa multimodal. Acredito que num futuro próximo veremos mais inovações semelhantes aplicadas em vários campos, promovendo ainda mais o avanço da tecnologia de recuperação de informação. O editor do Downcodes continuará atento ao desenvolvimento de tecnologias relacionadas e trazendo mais informações de ponta aos leitores.