Google lança uma nova versão atualizada da série de modelos Gemini 1.5, Gemini-1.5-Pro-002 e Gemini-1.5-Flash-002 fazem uma estreia chocante! O editor do Downcodes aprendeu que esta atualização não só traz uma melhoria significativa no desempenho, mas também uma redução significativa de preço, o que pode ser descrito como uma boa notícia importante no campo do desenvolvimento de IA. A melhoria de desempenho é surpreendente e o custo é reduzido em mais da metade, o que é sem dúvida muito atraente para desenvolvedores e usuários corporativos. Vamos dar uma olhada nas melhorias interessantes que esta atualização traz.
O Google anunciou hoje o lançamento de uma nova série de modelos Gemini atualizados, incluindo Gemini-1.5-Pro-002 e Gemini-1.5-Flash-002. Esta atualização não apenas melhora muito o desempenho, mas também traz descontos surpreendentes nos preços, o que sem dúvida desencadeará um boom no círculo de desenvolvimento de IA.
Em primeiro lugar, o que mais chama a atenção é a significativa redução de preços. O custo de utilização da nova versão do modelo foi reduzido pela metade, em mais de 50%. Ao mesmo tempo, o desempenho foi significativamente melhorado. A velocidade de processamento do Gemini1.5Flash é duplicada, enquanto a do Gemini1.5Pro é quase triplicada. Isso significa que os desenvolvedores podem obter resultados mais rápidos e latência mais curta a um custo menor, melhorando significativamente a eficiência do desenvolvimento.

Em termos de desempenho, o novo modelo Gemini apresenta melhorias abrangentes. Especialmente em matemática, processamento de textos longos e tarefas visuais, o progresso é particularmente óbvio. Por exemplo, os modelos agora podem processar facilmente documentos PDF com mais de 1.000 páginas, responder perguntas contendo dezenas de milhares de linhas de código e até mesmo extrair informações úteis de um vídeo de uma hora. No desafiador teste de benchmark MMLU-Pro, o novo modelo alcança aproximadamente 7% de melhoria de desempenho. Ainda mais impressionante é que nos benchmarks MATH e HiddenMath, a melhoria chega a 20%.

O Google também otimizou a qualidade de resposta do modelo. A nova versão fornece respostas mais úteis e concisas, ao mesmo tempo que mantém o conteúdo seguro. Em tarefas como resumo, perguntas e respostas e extração de informações, o comprimento da saída é reduzido em 5% a 20% em comparação com antes, o que não apenas melhora a eficiência, mas também reduz ainda mais os custos de uso.
Para usuários corporativos, os recursos de processamento de texto longo (até 2 milhões de palavras) e multimodais do Gemini1.5Pro abrem novos cenários de aplicação. A partir de 1º de outubro de 2024, os preços dos tokens de entrada, tokens de saída e tokens de cache incremental serão reduzidos em 64%, 52% e 64%, respectivamente, o que sem dúvida reduzirá bastante o custo do uso de IA para empresas.

O Google também fez ajustes significativos no que diz respeito às restrições de uso. O limite de taxa de serviço pago do Gemini1.5Flash foi aumentado para 2.000 solicitações por minuto, e 1.5Pro foi aumentado para 1.000 solicitações, o que fornece aos desenvolvedores maior flexibilidade.
A segurança sempre foi uma área de foco importante para o Google. A nova versão do modelo aumenta ainda mais a segurança ao seguir as instruções do usuário. O Google também ajustou as configurações padrão dos filtros para dar mais autonomia aos desenvolvedores.
Além disso, o Google também lançou uma versão melhorada do modelo experimental Gemini1.5Flash-8B, que funciona bem em cenários de texto e aplicativos multimodais. Esta versão foi lançada no Google AI Studio e na API Gemini, oferecendo aos desenvolvedores mais opções.
Para usuários do Gemini Advanced, em breve eles poderão experimentar a versão Gemini1.5Pro-002 otimizada para chat.
Referência: https://developers.googleblog.com/en/updated-production-ready-gemini-models-reduced-15-pro-pricing-increased-rate-limits-and-more/
Em suma, a atualização da série de modelos Gemini 1.5 trouxe enormes benefícios para desenvolvedores e empresas de IA. Custos mais baixos, velocidades mais rápidas, desempenho mais poderoso e experiência de uso mais conveniente indicam o futuro dos aplicativos de IA. O editor do Downcodes espera ver as maravilhosas aplicações da série Gemini 1.5 em vários campos!