Dans la dernière mise à jour de Huggingface, la plus grande communauté open source d'IA au monde, Alibaba a récemment lancé le modèle d'inférence Tongyi Qianwen QWQ-32B a remporté la première place de la liste des grands modèles. Ce modèle a attiré une attention généralisée après sa sortie, dépassant des modèles bien connus tels que Microsoft's PHI-4 et Deepseek-R1, et montrant des performances solides.

Le modèle QWQ-32B a fait un saut qualitatif en mathématiques, le traitement du code et les capacités générales, en particulier son petit nombre de paramètres, ce qui rend ses performances globales comparables à celles de Deepseek-R1. De plus, la conception de ce modèle permet aux utilisateurs d'implémenter un déploiement local sur les cartes graphiques de consommation, réduisant considérablement le coût de l'application du modèle. Cette percée offre à plus d'utilisateurs un choix d'application d'IA plus pratique et économique.
Parmi plusieurs repères faisant autorité, le modèle QWQ-32B a très bien fonctionné, dépassant presque complètement O1-MinI d'OpenAI et comparable aux performances de Deepseek-R1. Surtout dans l'ensemble d'évaluation AIME24 pour les capacités mathématiques et le LivecodeBench, les scores QWQ-32B sont comparables à Deepseek-R1, bien en avance sur l'O1-MINI et son modèle de distillation R1 de même taille.
À l'heure actuelle, le modèle QWQ-32B a été ouvert sur des plates-formes telles que Modai Community, HuggingFace et GitHub basée sur le protocole APACHE2.0 lâche. Tout le monde peut le télécharger et le déployer localement gratuitement. Dans le même temps, les utilisateurs peuvent également appeler directement le service API du modèle via la plate-forme Alibaba Cloud Baillian.
Points clés: Le modèle QWQ-32B se classe en premier sur la liste des étreintes, dépassant plusieurs modèles bien connus. Ce modèle réalise des percées en matière de performances et de coûts d'application, et prend en charge le déploiement local des cartes graphiques de qualité grand public. Excellentes performances dans plusieurs repères, comparables au modèle le plus fort Deepseek-R1.