Shusen Puyu 2.5—-internlm2.5-7b Модель объявила о поддержке с открытым исходным кодом для обработки статей на миллион слов-статьи AI

Автор：Eve Cole Время обновления：2025-02-22 07:25:02

3 июля 2024 года лаборатория искусственного интеллекта Шанхай объединила руки с Sensetime, совместно выпустила новое поколение крупной языковой модели - Scholar Puyu 2.5 (Internlm2.5). Этот выпуск знаменует собой важный шаг в технологических инновациях Китая в области искусственного интеллекта, особенно в области исследования и применения крупных языковых моделей.

Модель Internlm2.5-7b была официально открытым исходным кодом, а другие модели масштаба будут открыты для публики один за другим. Шанхайская лаборатория искусственного интеллекта обещает продолжать предоставлять бесплатное коммерческое лицензирование и поддержать инновации и развитие глобальных сообществ с помощью высококачественных моделей с открытым исходным кодом. Этот шаг не только снижает порог применения технологий искусственного интеллекта, но также предоставляет более инновационные возможности для глобальных разработчиков.

微信截图_20240708083247.png

Internlm2.5 добился значительных улучшений в нескольких ключевых областях. Во-первых, его способность к выводу была значительно повышена, и производительность некоторых измерений даже превосходит модель Llama3-70B. Особенно в наборе математики математической оценки, Internlm2.5 достигает 100% улучшения производительности и имеет точность 60%, что сопоставимо с версией GPT-4 Turbo 1106. Этот прорывной прогресс обеспечивает более мощный инструмент для решения сложных проблем.

Во -вторых, internlm2.5 поддерживает возможности обработки контекста до 1 млн. Токенов и может обрабатывать длинные статьи в размере около 1,2 миллиона китайских иероглиф. Увеличивая длину контекста и синтетические данные, модель оптимизирована для длинного понимания документов и взаимодействия с агентом, что делает ее более удобной при работе со сложным текстом.

Кроме того, internlm2.5 также имеет возможность самостоятельно планировать и звонить в инструмент. Он может искать и интегрировать информацию с сотен веб-страниц и моделировать процессы человеческого мышления через многоагентную структуру MindSearch для эффективной интеграции сетевой информации. Эта функция предоставляет новое решение для поиска информации и интеграции знаний, значительно улучшая практичность и интеллект модели.

Разработчики могут получить больше информации и ресурсов о Internlm2.5 по следующим ссылкам:

Ссылка GitHub: https://github.com/internlm/internlm

Ссылка на модель: https://www.modelscope.cn/models/shanghai_ai_laboratory/internlm2_5-7b-chat

Ученый Puyu Home страница: https://internlm.intern-ai.org.cn/