Shusen Puyu 2.5—— Internlm2.5-7b 모델 발표 백만 단어 긴 기사 처리를위한 오픈 소스 지원-AI 기사

저자：Eve Cole 업데이트 시간：2025-02-22 07:25:02

2024 년 7 월 3 일, 상하이 인공 지능 실험실은 Sensetime과 손을 잡고 새로운 세대의 대형 언어 모델 인 Puyu 2.5 (Internlm2.5)를 공동으로 발표했습니다. 이 릴리스는 인공 지능 분야의 중국 기술 혁신, 특히 대형 언어 모델의 연구 및 적용에서 중요한 단계입니다.

InternLM2.5-7B 모델은 공식적으로 오픈 소스였으며 다른 규모의 모델이 공개적으로 개방 될 것입니다. 상하이 인공 지능 실험실은 고품질 오픈 소스 모델을 통해 무료 상업 라이센스를 계속 제공하고 글로벌 커뮤니티의 혁신 및 개발을 지원할 것을 약속합니다. 이러한 움직임은 인공 지능 기술의 애플리케이션 임계 값을 낮출뿐만 아니라 글로벌 개발자에게보다 혁신적인 기회를 제공합니다.

微信截图_20240708083247.png

Internlm2.5는 여러 주요 영역에서 크게 개선되었습니다. 첫째, 추론 능력이 크게 향상되었으며 일부 차원의 성능은 LLAMA3-70B 모델을 능가합니다. 특히 수학적 평가 세트 수학에서 Internlm2.5는 100% 성능 향상을 달성하고 60%의 정확도를 가지고 있으며 이는 GPT-4 터보 1106 버전과 비슷합니다. 이 획기적인 진행 상황은 복잡한 문제를 해결하기위한보다 강력한 도구를 제공합니다.

둘째, Internlm2.5는 최대 1m 토큰의 컨텍스트 처리 기능을 지원하며 약 120 만 명의 한자의 긴 기사를 처리 할 수 있습니다. 컨텍스트 길이와 합성 데이터를 증가 시킴으로써이 모델은 긴 문서 이해와 에이전트 상호 작용에 최적화되어 복잡한 텍스트를 다룰 때 더욱 편리합니다.

또한 InternLM2.5는 독립적으로 계획하고 통화 할 수있는 기능이 있습니다. 수백 개의 웹 페이지에서 정보를 검색하고 통합하고 Mindsearch Multi-Agent 프레임 워크를 통해 인간 사고 프로세스를 시뮬레이션하여 네트워크 정보를 효과적으로 통합 할 수 있습니다. 이 기능은 정보 검색 및 지식 통합을위한 새로운 솔루션을 제공하여 모델의 실용성과 지능을 크게 향상시킵니다.

개발자는 다음 링크를 통해 Internlm2.5에 대한 자세한 정보와 리소스를 얻을 수 있습니다.

github 링크 : https://github.com/internlm/internlm

모델 링크 : https://www.modelscope.cn/models/shanghai_ai_laboratory/internlm2_5-7b-chat

학자 Puyu 홈페이지 : https://internlm.intern-ai.org.cn/