La plate-forme SiliconCloud a récemment annoncé le lancement de la fonction d'inférence par lots de Deepseek-R1 et V3API, offrant aux utilisateurs des solutions de traitement de données à grande échelle plus efficaces. Grâce à cette fonction, les utilisateurs peuvent envoyer des demandes de lots à la plate-forme, se débarrasser des limites du taux d'inférence en temps réel et effectuer des tâches de traitement des données dans les 24 heures. Le lancement de cette fonctionnalité marque l'innovation supplémentaire par SiliconCloud dans le domaine des services d'intelligence artificielle.
Cette mise à jour a non seulement provoqué des améliorations fonctionnelles, mais également accompagnées d'une réduction significative des prix. Le prix de l'inférence du lot Deepseek-V3 est réduit de 50% par rapport à l'inférence en temps réel, ce qui permet aux utilisateurs de nombreux coûts. En outre, du 11 mars au 18 mars, le raisonnement par lots Deepseek-R1 a lancé une remise à durée limitée, le prix des intrants n'est que 1 yuan / million de jetons et le prix de production est de 4 jetons yuans / millions, une baisse de 75%. Cette politique préférentielle fournit sans aucun doute aux utilisateurs un choix plus rentable.

Le lancement de la fonction de raisonnement par lots est conçu pour répondre aux besoins des utilisateurs lors de la gestion des tâches à grande échelle telles que la génération de rapports et le nettoyage des données. Par rapport à l'inférence en temps réel, l'inférence par lots est plus appropriée pour les scénarios qui ne nécessitent pas de réponse immédiate, tels que l'analyse des données, l'évaluation des performances du modèle, etc. Grâce à cette fonctionnalité, les utilisateurs peuvent effectuer des tâches de traitement des données complexes dans un temps plus court tout en bénéficiant de coûts inférieurs.
Il convient de mentionner que Deepseek-R1 et V3API ont déjà pris en charge un certain nombre de fonctions, notamment Fonction Calling, JSON Mode, Prefix et FIM. De plus, le plafond TPM (jeton traité par minute) de la version pro de Deepseek-R1 et V3API est passé de 10 000 à 1 million, améliorant encore sa puissance de traitement. Ces mises à jour rendent la plate-forme SiliconCloud plus compétitive dans le domaine des services d'intelligence artificielle et fournissent aux utilisateurs un support technique plus fort.