A plataforma SiliconCloud anunciou recentemente o lançamento da função de inferência em lote da Deepseek-R1 e V3API, fornecendo aos usuários soluções de processamento de dados em larga escala mais eficientes. Por meio dessa função, os usuários podem enviar solicitações de lote para a plataforma, livrar-se das limitações da taxa de inferência em tempo real e concluir as tarefas de processamento de dados dentro de 24 horas. O lançamento desse recurso marca a inovação adicional da SiliconCloud no campo dos serviços de inteligência artificial.
Esta atualização não apenas provocou melhorias funcionais, mas também acompanhada por uma redução significativa de preços. O preço da inferência em lote Deepseek-V3 é reduzido em 50% em comparação com a inferência em tempo real, economizando muitos custos. Além disso, de 11 de março a 18 de março, o raciocínio do DeepSeek-R1 em lote lançou um desconto de tempo limitado, com o preço de entrada apenas 1 yuan/milhão de tokens e o preço da produção é de 4 yuan/milhão de tokens, uma queda de 75%. Essa política preferencial, sem dúvida, fornece aos usuários uma escolha mais econômica.

O lançamento da função de raciocínio em lote foi projetado para atender às necessidades dos usuários ao lidar com tarefas em larga escala, como gerar relatórios e limpeza de dados. Comparado com a inferência em tempo real, a inferência em lote é mais adequada para cenários que não requerem resposta imediata, como análise de dados, avaliação de desempenho do modelo, etc. Através desse recurso, os usuários podem concluir tarefas complexas de processamento de dados em um tempo mais curto e desfrutar de custos mais baixos.
Vale ressaltar que o DeepSeek-R1 & V3API já havia suportado várias funções, incluindo chamadas de funções, modo JSON, prefixo e FIM. Além disso, o limite TPM (Token processado por minuto) da versão Pro do Deepseek-R1 e V3API aumentou de 10.000 para 1 milhão, aumentando ainda mais seu poder de processamento. Essas atualizações tornam a plataforma SilicoCloud mais competitiva no campo dos serviços de inteligência artificial e fornece aos usuários suporte mais forte.