2024 년 7 월 3 일, 상하이 인공 지능 실험실은 Sensetime과 손을 잡고 새로운 세대의 대형 언어 모델 인 Puyu 2.5 (Internlm2.5)를 공동으로 발표했습니다. 이 릴리스는 인공 지능 분야의 중국 기술 혁신, 특히 대형 언어 모델의 연구 및 적용에서 중요한 단계입니다.
InternLM2.5-7B 모델은 공식적으로 오픈 소스였으며 다른 규모의 모델이 공개적으로 개방 될 것입니다. 상하이 인공 지능 실험실은 고품질 오픈 소스 모델을 통해 무료 상업 라이센스를 계속 제공하고 글로벌 커뮤니티의 혁신 및 개발을 지원할 것을 약속합니다. 이러한 움직임은 인공 지능 기술의 애플리케이션 임계 값을 낮출뿐만 아니라 글로벌 개발자에게보다 혁신적인 기회를 제공합니다.

Internlm2.5는 여러 주요 영역에서 크게 개선되었습니다. 첫째, 추론 능력이 크게 향상되었으며 일부 차원의 성능은 LLAMA3-70B 모델을 능가합니다. 특히 수학적 평가 세트 수학에서 Internlm2.5는 100% 성능 향상을 달성하고 60%의 정확도를 가지고 있으며 이는 GPT-4 터보 1106 버전과 비슷합니다. 이 획기적인 진행 상황은 복잡한 문제를 해결하기위한보다 강력한 도구를 제공합니다.
둘째, Internlm2.5는 최대 1m 토큰의 컨텍스트 처리 기능을 지원하며 약 120 만 명의 한자의 긴 기사를 처리 할 수 있습니다. 컨텍스트 길이와 합성 데이터를 증가 시킴으로써이 모델은 긴 문서 이해와 에이전트 상호 작용에 최적화되어 복잡한 텍스트를 다룰 때 더욱 편리합니다.
또한 InternLM2.5는 독립적으로 계획하고 통화 할 수있는 기능이 있습니다. 수백 개의 웹 페이지에서 정보를 검색하고 통합하고 Mindsearch Multi-Agent 프레임 워크를 통해 인간 사고 프로세스를 시뮬레이션하여 네트워크 정보를 효과적으로 통합 할 수 있습니다. 이 기능은 정보 검색 및 지식 통합을위한 새로운 솔루션을 제공하여 모델의 실용성과 지능을 크게 향상시킵니다.
개발자는 다음 링크를 통해 Internlm2.5에 대한 자세한 정보와 리소스를 얻을 수 있습니다.
github 링크 : https://github.com/internlm/internlm
모델 링크 : https://www.modelscope.cn/models/shanghai_ai_laboratory/internlm2_5-7b-chat
학자 Puyu 홈페이지 : https://internlm.intern-ai.org.cn/