世界中で広く注目されている中国のAI会社Deepseekによって開始された推論モデルDeepseek-R1により、サードパーティのプラットフォームでの安定性パフォーマンスは、最近テクノロジーサークルのホットトピックになりました。 Xプラットフォームに関する最新のディスカッションとレビューデータによると、DeepSeek-R1のパフォーマンスはホスティングプラットフォームによって大きく異なり、完全性、精度、推論時間はプラットフォームの選択によって異なります。この現象は、モデルの展開の複雑さを明らかにするだけでなく、ユーザーが適切なホスティングサービスを選択するための重要なリファレンスを提供します。
背景と方法のテストに関しては、Xユーザーと専門的な評価機関からのフィードバックによると、DeepSeek-R1の最近のクロスプラットフォーム安定性テストが広範囲にわたる注目を集めています。このテストは、中国のソフトウェア評価センターの人工知能部門が主導し、ナノアイ検索、アリババベイリアン、シリコンベースのフローなどを含む国内および外国のサードパーティのプラットフォームを超えて、ベンチマークとして統一された20の基本的な数学的推論問題(SuperClueチームによって開発された)を使用しています。この評価は、主に、回答率、精度、推論時間の3つの次元に焦点を当て、無料サービスと有料サービスの違いを分析します。

テスト結果は、DeepSeek-R1の安定性がホスティングプラットフォームに大きく依存していることを示しています。 Nano AI検索は、「フルブラッドバージョン」DeepSeek-R1に接続し、無料で提供するため、特に傑出しています。 Xユーザー @op7418 2月27日に投稿:「ナノミックAI検索は、初めてDeepSeek-R1の全血版に接続され、評価でうまく機能しました。」このプラットフォームは、その高い回答率と安定した出力で賞賛を獲得し、周hongyiの「AI普及」という概念の実践であると考えられています。
ただし、他のプラットフォームのパフォーマンスは満足のいくものではありません。 Xユーザー @Simonkuang938は、2月24日に、Alibaba BailianのDeepseek-R1が複雑な論理タスク(描画チャートやフローチャートなど)を扱うとき、メモリの過剰なメモリ消費のために切断されることが多いことを指摘しました。彼は冗談めかしてこの経験を「悪い」と呼び、一部のユーザーの安定性に対する不満を反映していた。
対照的に、シリコンベースの流動性は、ボーナスの使用を制限し、安定した有料バージョンを提供するため、 @Simonkuang938によって認識されます。彼は2月22日に次のように述べています。「シリコンベースのフローほど良心的なプラットフォームは少なすぎます。R1は本格的なバージョンであり、変更されていません。」これは、有料サービスが安定性においてより多くの利点がある可能性があることを示しています。
Xに関するユーザーフィードバックから判断すると、さまざまなシナリオでのDeepSeek-R1のパフォーマンスにも独自の利点があります。 @changli71829684は、2月25日に、R1が1回の会話で3,000語以上を出力するときにデッドサイクルになる傾向があると述べました。その情報密度は高く、知識採掘に適していますが、その精度と生産品質はわずかに不十分です。彼は、このモデルは正確なタスクよりも「マインドオープン」により適していると考えています。さらに、 @oran_geは、監視されていない微調整(SFT)バージョンが、特定のシナリオでモデルの不安定性を示す「hello」に返信する際の数学式を出力するなど、簡単な質問で奇妙であることを発見しました。
一部のユーザーは、R1のユーザーエクスペリエンスを最適化しようとすることに言及する価値があります。 @Oran_geは、2月12日にAPIを介してインターネットに接続するソリューションを共有し、「実際には最も安定した最速のR1ユーザーエクスペリエンスである」と述べ、ラグとネットワーキングの問題を完全に解決しました。この調査では、プラットフォーム外の技術的な構成も安定性に影響する可能性があることを示しています。
このクロスプラットフォームテストは、DeepSeek-R1の展開課題を公開するだけでなく、オープンソースモデルの商業化と安定性に関する議論を引き起こしました。 Xユーザーは一般に、DeepSeek-R1は数学的およびプログラミングベンチマーク(Math-500スコア97.3%など)でうまく機能しますが、実際のアプリケーションでの安定性を最適化する必要があると考えています。交通圧力とフリーサービスの高い負荷はパフォーマンスの劣化につながる可能性がありますが、有料プラットフォームはリソースの割り当てを通じてより信頼性の高いエクスペリエンスを提供します。
この点で、業界のインサイダーは、ユーザーがニーズに応じてホスティングプラットフォームを選択することを推奨しています。高い応答率と完全な出力を追求する開発者にとって、Nano-AI検索やシリコンベースのフローなどの安定したサービスは良い選択です。複雑な推論タスクを処理する必要があるユーザーの場合、有料プラットフォームはニーズをよりよく満たすことができる場合があります。一方、Deepseekの役人は、2月8日の投稿で@Graypsycheが予想していたように、無料サービスの渋滞の問題を軽減するために、より多くのハードウェアサポートまたは有料層を求められています。
DeepSeek-R1のサードパーティプラットフォームの安定性評価は重要な事実を明らかにしています。モデルには大きな可能性がありますが、実際のパフォーマンスは環境をホストすることによって異なります。 Nano AI検索の効率的で無料のサービスから、Alibaba Bailianのカットオフ問題、シリコンベースのフローの安定した有料エクスペリエンスまで、ユーザーはコストとパフォーマンスを検討する必要があります。 AIテクノロジーの人気により、Deepseek-R1の将来の発展とグローバル市場での競争力は、これらの安定性の課題を解決できるかどうかに依存する可能性があります。 Xプラットフォームでのホットな議論は依然として継続しており、このトピックは間違いなく業界の注目を集め続けます。