Kunlun Wanwei는 싱가포르 난양 기술 대학교와 협력하여 기존 대형 모델의 추론 능력을 크게 향상시킬 수 있는 Q*라는 알고리즘을 성공적으로 개발했습니다. 이러한 획기적인 발전을 통해 소형 모델은 수십 배, 심지어 수백 배 더 큰 매개변수를 가진 모델의 추론 능력에 도달하거나 심지어 능가하는 동시에 컴퓨팅 리소스에 대한 수요를 크게 줄일 수 있습니다. Q* 알고리즘의 출현은 인공지능의 광범위한 적용을 위한 새로운 장을 열었고, 효율적인 지능의 새로운 시대의 도래를 예고했습니다. 본 연구 결과는 "Q*: Improving Multi-step Reasoning for LLMs with Deliberative Planning"이라는 논문에 게재되었으며, 자세한 기술적 설명을 제공합니다.

연구원들은 대규모 언어 모델의 추론 궤적을 여러 상태로 분해하고 A* 검색 알고리즘을 사용하여 전반적인 계획을 달성함으로써 추론 작업에 대한 오픈 소스 모델의 성능을 미묘하게 개선했습니다. 경로 비용 함수와 누적 보상 함수를 정의함으로써 과거 상태 수익과 미래 예상 수익에 대한 포괄적인 고려가 이루어졌으며, 실험에서 잘 알려진 일부 모델을 능가하는 상당한 정확도 향상이 달성되었습니다. 현재 Q* 연구는 아직 초기 단계지만, 앞으로 국내 오픈소스 모델의 추론 능력을 더욱 향상시켜 인공지능 기술 발전에 더욱 기여할 것으로 기대된다.
구체적으로 Q*는 과거 상태 수익률과 미래 예상 수익률을 종합적으로 고려하여 추론 프로세스를 최적화합니다. 실험 결과에 따르면 Q*는 여러 데이터 세트에서 상당한 성능 향상을 달성했으며 이는 인공 지능 기술 발전에 새로운 방향을 제시합니다.
현재 Q*에 대한 연구는 아직 초기 단계이며 개선의 여지가 여전히 남아 있습니다. 앞으로도 Kunlun Wanwei는 국내 오픈 소스 모델의 추론 능력을 향상하고 인공 지능 기술 개발에 더 많은 가능성을 가져오기 위해 심층적인 연구를 계속할 것입니다.
논문 링크:
https://arxiv.org/abs/2406.14283
Q* 알고리즘의 성공적인 개발은 인공지능 분야에서 중요한 진전을 의미하며 향후 인공지능 기술의 발전 방향을 제시하는 것으로, 더 많은 분야에서의 활용과 획기적인 발전을 기대해볼 만하다.