전 세계적으로 광범위한 관심을 끌고있는 중국 AI Company DeepSeek에 의해 출시 된 추론 모델 DeepSeek-R1을 통해 제 3 자 플랫폼에서의 안정성 성능은 최근 기술 서클에서 인기있는 주제가되었습니다. X 플랫폼의 최신 토론 및 검토 데이터에 따르면 DeepSeek-R1의 성능은 호스팅 플랫폼마다 크게 다르며 플랫폼 선택에 따라 완전성, 정확성 및 추론 시간이 다양합니다. 이 현상은 모델 배포의 복잡성을 보여줄뿐만 아니라 사용자가 적절한 호스팅 서비스를 선택할 수있는 중요한 참조를 제공합니다.
테스트 배경 및 방법 측면에서 X 사용자 및 전문 평가 대행사의 피드백에 따르면 DeepSeek-R1에 대한 최근의 크로스 플랫폼 안정성 테스트가 널리 퍼져 나갔습니다. 이 테스트는 인공 지능 국 소프트웨어 평가 센터 (Artificial Intelligence Department of China Software Evaluation Center)에 의해 주도되었으며, 벤치 마크로서 Superclue 팀이 개발 한 20 기본 수학적 추론 문제 (Superclue Team이 개발 한)를 사용하여 Nano-AI 검색, Alibaba Bailian, Silicon 기반 흐름 등을 포함한 12 개 이상의 국내 및 외국 제 3 자 플랫폼이 주도되었습니다. 평가는 주로 응답 속도, 정확도 및 추론 시간의 세 가지 차원에 중점을두고 무료 서비스와 유료 서비스의 차이점을 분석합니다.

테스트 결과는 DeepSeek-R1의 안정성이 호스팅 플랫폼에 크게 의존 함을 보여줍니다. 나노 AI 검색은 "풀 혈액 버전"DeepSeek-R1에 연결되어 무료로 제공하기 때문에 특히 뛰어납니다. X user @op7418 2 월 27 일에 게시 됨 : "나노 믹 AI 검색은 처음으로 DeepSeek-R1의 전혈 버전에 연결되어 평가에서 잘 수행되었습니다." 이 플랫폼은 높은 응답 속도와 안정적인 출력으로 칭찬을 받았으며 Zhou Hongyi의 "AI 대중화"개념의 관행으로 간주됩니다.
그러나 다른 플랫폼의 성능은 만족스럽지 않습니다. X user @simonkuang938은 2 월 24 일에 Alibaba Bailian의 DeepSeek-R1이 복잡한 논리적 작업 (예 : 도표 차트 또는 흐름도 도면)을 다룰 때 과도한 메모리 소비로 인해 종종 연결이 끊어지지 않지만 종종 연결이 연결되지 않았다고 지적했습니다. 그는 농담 으로이 경험을 "나쁜"이라고 불렀습니다. 일부 사용자의 안정성에 대한 불만족을 반영했습니다.
대조적으로, 실리콘 기반 유동성은 @simonkuang938에 의해 인식되고 보너스의 사용을 제한하고 안정적인 유료 버전을 제공하기 때문입니다. 그는 2 월 22 일에 "실리콘 기반 흐름만큼 양심적 인 플랫폼이 너무 적다. R1은 전혈 버전이며 수정되지 않았다." 이것은 유료 서비스가 안정성이 더 많은 장점을 가질 수 있음을 보여줍니다.
X에 대한 사용자 피드백으로 판단하면 다양한 시나리오에서 DeepSeek-R1의 성능에도 고유 한 장점이 있습니다. @changli71829684 2 월 25 일에 R1이 단일 대화에서 3,000 개 이상의 단어를 출력 할 때 R1이 죽은주기에 빠지기 쉽다고 언급했습니다. 정보 밀도가 높고 지식 광업에 적합하지만 정확도와 생산 품질은 약간 불충분합니다. 그는이 모델이 정확한 작업보다 "마음의 개방"에 더 적합하다고 생각합니다. 또한 @oran_ge는 감독되지 않은 미세 조정 (SFT) 버전이 특정 시나리오에서 모델의 불안정성을 보여주는 "hello"에 응답 할 때 수학 공식을 출력하는 것과 같은 간단한 질문에 이상하다는 것을 발견했습니다.
일부 사용자는 R1의 사용자 경험을 최적화하려고 시도한다는 것을 언급 할 가치가 있습니다. @oran_ge는 2 월 12 일 API를 통해 인터넷에 연결할 수있는 솔루션을 공유했으며, "실제로 측정 된 것은 가장 안정적이고 빠른 R1 사용자 경험"이라고 말하면서 지연과 네트워킹 문제를 완전히 해결했습니다. 이 탐색은 플랫폼 외부의 기술 구성이 안정성에도 영향을 줄 수 있음을 보여줍니다.
이 크로스 플랫폼 테스트는 DeepSeek-R1의 배포 문제를 노출시킬뿐만 아니라 오픈 소스 모델의 상용화 및 안정성에 대한 토론을 촉발 시켰습니다. X 사용자는 일반적으로 DeepSeek-R1이 수학 및 프로그래밍 벤치 마크 (예 : Math-500 점수 97.3%)에서 잘 작동하지만 실제 응용 프로그램의 안정성은 여전히 최적화되어야한다고 생각합니다. 교통 압력과 많은 무료 서비스는 성능 저하로 이어질 수 있으며 유료 플랫폼은 자원 할당을 통해보다 안정적인 경험을 제공합니다.
이와 관련하여 업계 내부자는 사용자가 자신의 요구에 따라 호스팅 플랫폼을 선택할 것을 권장합니다. 높은 응답 속도와 완전한 출력을 추구하는 개발자의 경우 Nano-IA 검색 또는 실리콘 기반 흐름과 같은 안정적인 서비스가 좋은 선택입니다. 복잡한 추론 작업을 처리 해야하는 사용자의 경우 유료 플랫폼이 필요를 더 잘 충족시킬 수 있습니다. 한편 @Graypsyche가 2 월 8 일 포스트에서 예상 한대로 무료 서비스의 혼잡 문제를 완화하기 위해 더 많은 하드웨어 지원 또는 유료 계층을 요구하고 있습니다.
DeepSeek-R1의 타사 플랫폼 안정성 평가는 핵심 사실을 보여줍니다. 모델은 큰 잠재력을 가지고 있지만 실제 성능은 환경을 호스팅마다 다릅니다. Nano AI 검색의 효율적이고 무료 서비스에서 Alibaba Bailian의 컷오프 문제, 실리콘 기반 흐름의 안정적인 유료 경험에 이르기까지 사용자는 비용과 성능을 평가해야합니다. AI 기술의 인기에 따라 DeepSeek-R1의 미래 개발과 글로벌 시장의 경쟁력은 이러한 안정성 문제를 해결할 수 있는지 여부에 달려 있습니다. X 플랫폼에 대한 핫 토론은 여전히 계속되고 있으며,이 주제는 의심 할 여지없이 업계의 관심을 계속 끌어들일 것입니다.