昆仑万维与新加坡南洋理工大学合作,成功研发了一种名为Q*的算法,该算法能够显着提升现有大模型的推理能力。这项突破性进展使得小模型能够达到甚至超越参数量大数十倍甚至上百倍模型的推理能力,同时大幅降低了计算资源的需求。 Q*算法的出现,为人工智能的广泛应用打开了新的篇章,预示着高效智能的新时代即将到来。这项研究成果已发表在论文《Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning》中,并提供了详细的技术解读。

研究人员通过将大语言模型的推理轨迹分解为若干个状态,并利用A*搜索算法实现全盘规划,巧妙地提升了开源模型在推理任务上的性能。通过定义Path Cost函数和Accumulated Reward函数,实现了对历史状态收益和未来期望收益的综合考虑,在实验中取得了显着的准确率提升,超越了一些知名模型。目前,Q*的研究仍处于初级阶段,但其潜力巨大,未来有望进一步提升国产开源模型的推理能力,为人工智能技术发展贡献更多力量。
具体来说,Q*通过对历史状态收益和未来期望收益的综合考虑,实现了对推理过程的优化。实验结果显示,Q*在多个数据集上都取得了显着的性能提升,这为人工智能技术的进步提供了新的方向。
目前,Q * 的研究还处于初级阶段,仍有改进空间。未来,昆仑万维将继续深入研究,提升国产开源模型的推理能力,为人工智能技术发展带来更多可能。
论文链接:
https://arxiv.org/abs/2406.14283
Q*算法的成功研发,标志着人工智能领域取得了重要进展,为未来人工智能技术的发展指明了方向,值得期待其在更多领域的应用与突破。