Kunlun Wanwei a coopéré avec l'Université technologique de Nanyang à Singapour et a développé avec succès un algorithme appelé Q*, qui peut améliorer considérablement les capacités de raisonnement des grands modèles existants. Ce développement révolutionnaire permet aux petits modèles d’atteindre, voire de surpasser, les capacités de raisonnement des modèles comportant des dizaines, voire des centaines de fois de paramètres plus grands, tout en réduisant considérablement la demande en ressources informatiques. L’émergence de l’algorithme Q* a ouvert un nouveau chapitre pour l’application généralisée de l’intelligence artificielle, annonçant l’avènement d’une nouvelle ère d’intelligence efficace. Ce résultat de recherche a été publié dans l'article « Q* : Improving Multi-step Reasoning for LLMs with Deliberative Planning » et fournit une explication technique détaillée.

Les chercheurs ont intelligemment amélioré les performances du modèle open source sur les tâches d'inférence en décomposant la trajectoire d'inférence du grand modèle de langage en plusieurs états et en utilisant l'algorithme de recherche A* pour réaliser une planification globale. En définissant la fonction Path Cost et la fonction Accumulated Reward, la prise en compte complète des rendements historiques et des rendements futurs attendus a été obtenue, et des améliorations significatives de la précision ont été obtenues dans les expériences, surpassant certains modèles bien connus. À l'heure actuelle, la recherche sur Q* en est encore à ses balbutiements, mais son potentiel est énorme. À l'avenir, elle devrait améliorer encore les capacités de raisonnement des modèles open source nationaux et contribuer davantage au développement de la technologie de l'intelligence artificielle.
Plus précisément, Q* optimise le processus de raisonnement en considérant de manière globale les rendements historiques et les rendements futurs attendus. Les résultats expérimentaux montrent que Q* a obtenu des améliorations significatives des performances sur plusieurs ensembles de données, ce qui ouvre une nouvelle direction pour l'avancement de la technologie de l'intelligence artificielle.
Actuellement, la recherche sur Q* en est encore à ses balbutiements et il y a encore place à l’amélioration. À l'avenir, Kunlun Wanwei continuera à mener des recherches approfondies pour améliorer les capacités de raisonnement des modèles open source nationaux et offrir davantage de possibilités au développement de la technologie de l'intelligence artificielle.
Lien papier :
https://arxiv.org/abs/2406.14283
Le développement réussi de l'algorithme Q* marque un progrès important dans le domaine de l'intelligence artificielle et indique la direction du développement futur de la technologie de l'intelligence artificielle. Il vaut la peine d'attendre avec impatience ses applications et ses percées dans d'autres domaines.