Avec le modèle de raisonnement Deepseek-R1 lancé par la société chinoise d'IA Deepseek, qui a attiré une attention généralisée dans le monde entier, ses performances de stabilité sur les plates-formes tierces sont devenues un sujet brûlant dans le cercle technologique récemment. Selon les dernières données de discussion et de révision sur la plate-forme X, les performances de Deepseek-R1 varient considérablement entre les plates-formes d'hébergement, avec l'exhaustivité, la précision et le temps de raisonnement variant selon le choix de la plate-forme. Ce phénomène révèle non seulement la complexité du déploiement du modèle, mais fournit également une référence importante pour que les utilisateurs choisissent des services d'hébergement appropriés.
En termes de test et de méthodes, selon les commentaires de X utilisateurs et des agences d'évaluation professionnelles, un récent test de stabilité multiplateforme pour Deepseek-R1 a attiré une attention généralisée. Le test a été dirigé par le Centre d'évaluation des logiciels du Département de l'intelligence artificielle, et plus d'une douzaine de plateformes de tiers domestiques et étrangères, notamment la recherche Nano-AI, Alibaba Bailian, le flux basé sur le silicium, etc., en utilisant un benchmark unifié de base de base (développé par l'équipe SuperClue) comme repère. L'évaluation se concentre principalement sur trois dimensions: le taux de réponse, la précision et le temps de raisonnement, et analyse les différences entre les services gratuits et payants.

Les résultats des tests montrent que la stabilité de Deepseek-R1 dépend fortement de la plate-forme d'hébergement. La recherche Nano AI est particulièrement remarquable car elle se connecte à la "version sanguine complète" Deepseek-R1 et la fournit gratuitement. X User @ OP7418 Publié le 27 février: "La recherche Nanomic AI a été connectée à la version à sang complet de Deepseek-R1 à la première fois, et a bien fonctionné dans l'évaluation." Cette plate-forme a fait l'éloge de son taux de réponse élevé et de sa sortie stable, et est considérée comme une pratique du concept de "popularisation d'IA" de Zhou Hongyi.
Cependant, les performances d'autres plates-formes ne sont pas satisfaisantes. X User @ Simonkuang938 a souligné le 24 février que lorsque Deepseek-R1 d'Alibaba Bailian traite des tâches logiques complexes (telles que des graphiques de dessin ou des graphiques de débit), il est souvent tronqué en raison d'une consommation excessive de mémoire, ce qui entraîne le bégaiement du client, bien que la connexion ne soit pas déconnectée. Il a appelé en plaisantant cette expérience «mauvaise» reflétant l'insatisfaction de certains utilisateurs à l'égard de la stabilité.
En revanche, la liquidité à base de silicium est reconnue par @ Simonkuang938 car elle restreint l'utilisation de bonus et fournit une version payante stable. Il a déclaré le 22 février: "Il y a trop peu de plates-formes aussi consciencieuses que le flux basé sur le silicium. R1 est une version de sang à part entière et n'a pas été modifiée." Cela montre que les services payants peuvent avoir plus d'avantages dans la stabilité.
À en juger par les commentaires des utilisateurs sur X, les performances de Deepseek-R1 dans différents scénarios présentent également ses propres avantages. @ Changli71829684 a mentionné le 25 février que R1 est enclin à tomber dans un cycle mort lors de la sortie de plus de 3 000 mots dans une seule conversation. Bien que sa densité d'informations soit élevée et adaptée à l'extraction des connaissances, sa précision et sa qualité de production sont légèrement insuffisantes. Il pense que le modèle convient plus à "l'ouverture de l'esprit" que pour les tâches précises. De plus, @oran_ge a constaté que sa version de réglage fin non supervisé (SFT) était bizarre sur des questions simples, telles que la sortie des formules mathématiques lors de la réponse à "Hello" qui montre l'instabilité du modèle dans un scénario spécifique.
Il convient de mentionner que certains utilisateurs essaient d'optimiser l'expérience utilisateur de R1. @ORAN_GE a partagé une solution pour se connecter à Internet via l'API le 12 février, affirmant qu'il est "en fait mesuré est l'expérience utilisateur R1 la plus stable et la plus rapide", ce qui a complètement résolu le problème du décalage et du réseautage. Cette exploration montre que la configuration technique en dehors de la plate-forme peut également affecter la stabilité.
Ce test multiplateforme a non seulement exposé les défis de déploiement de Deepseek-R1, mais a également déclenché des discussions sur la commercialisation et la stabilité des modèles open source. Les utilisateurs X croient généralement que bien que Deepseek-R1 fonctionne bien dans les références mathématiques et en programmation (telles que les scores MATH-500 97,3%), sa stabilité dans les applications réelles doit encore être optimisée. La pression de trafic et la charge élevée de services gratuits peuvent entraîner une dégradation des performances, tandis que les plates-formes payantes offrent une expérience plus fiable grâce à l'allocation des ressources.
À cet égard, les initiés de l'industrie recommandent que les utilisateurs choisissent une plate-forme d'hébergement en fonction de leurs besoins. Pour les développeurs qui poursuivent des taux de réponse élevés et une production complète, des services stables tels que la recherche Nano-AI ou le flux basé sur le silicium sont de bons choix; Pour les utilisateurs qui ont besoin de gérer les tâches d'inférence complexes, les plates-formes payantes peuvent être mieux en mesure de répondre aux besoins. Pendant ce temps, les responsables Deepseek sont appelés à plus de soutien matériel ou à des niveaux payants pour atténuer le problème de congestion des services gratuits, comme @GrayPsyche attendu dans le poste du 8 février.
L'évaluation de la stabilité de la plate-forme tierce de Deepseek-R1 révèle un fait clé: bien que le modèle ait un grand potentiel, ses performances réelles varient selon l'environnement d'hébergement. Des services efficaces et gratuits pour la recherche Nano AI, au problème de coupure d'Alibaba Bailian, à l'expérience rémunérée stable du flux basé sur le silicium, les utilisateurs doivent peser les coûts et les performances. Avec la popularité de la technologie de l'IA, le développement futur de Deepseek-R1 et sa compétitivité sur le marché mondial peuvent dépendre de la résolution de ces défis de stabilité. La discussion chaude sur la plate-forme X se poursuit, et ce sujet continuera sans aucun doute d'attirer l'attention de l'industrie.