世界最大のAIオープンソースコミュニティであるHuggingfaceの最新のアップデートで、Alibabaは最近、Tongyi Qianwen推論モデルQWQ-32Bを発売しました。このモデルは、リリース後、MicrosoftのPHI-4やDeepSeek-R1などのよく知られたモデルを上回り、強力なパフォーマンスを示している広範な注目を集めています。

QWQ-32Bモデルは、数学、コード処理、一般的な機能、特に少数のパラメーターに定性的な飛躍を遂げました。これにより、全体的なパフォーマンスがDeepSeek-R1のパラメーターに匹敵します。さらに、このモデルの設計により、ユーザーは消費者グラフィックスカードにローカル展開を実装でき、モデルアプリケーションのコストを大幅に削減できます。このブレークスルーは、より多くのユーザーが、より便利で経済的なAIアプリケーションの選択を提供します。
複数の権威あるベンチマークの中で、QWQ-32Bモデルは非常にうまく機能し、OpenaiのO1-MINIをほぼ完全に上回り、DeepSeek-R1のパフォーマンスに匹敵します。特に、数学能力とliveCodebenchのAIME24評価セットでは、QWQ-32Bスコアは、O1-MINIとそのR1蒸留モデルのはるかに先のDeepSeek-R1に匹敵します。
現在、QWQ-32Bモデルは、緩いapache2.0プロトコルに基づいて、Modai Community、Huggingface、Githubなどのプラットフォームでオープンソースを受けています。誰でも無料でローカルにダウンロードして展開できます。同時に、ユーザーはAlibaba Cloud Bailianプラットフォームを介してモデルAPIサービスを直接呼び出すこともできます。
キーポイント:QWQ-32Bモデルは、Huggingfaceリストで最初にランク付けされ、いくつかのよく知られたモデルを上回ります。このモデルは、パフォーマンスとアプリケーションコストのブレークスルーを達成し、消費者グラフィックスカードのローカル展開をサポートします。複数のベンチマークで優れたパフォーマンスは、最も強力なモデルDeepSeek-R1に匹敵します。