3 июля 2024 года лаборатория искусственного интеллекта Шанхай объединила руки с Sensetime, совместно выпустила новое поколение крупной языковой модели - Scholar Puyu 2.5 (Internlm2.5). Этот выпуск знаменует собой важный шаг в технологических инновациях Китая в области искусственного интеллекта, особенно в области исследования и применения крупных языковых моделей.
Модель Internlm2.5-7b была официально открытым исходным кодом, а другие модели масштаба будут открыты для публики один за другим. Шанхайская лаборатория искусственного интеллекта обещает продолжать предоставлять бесплатное коммерческое лицензирование и поддержать инновации и развитие глобальных сообществ с помощью высококачественных моделей с открытым исходным кодом. Этот шаг не только снижает порог применения технологий искусственного интеллекта, но также предоставляет более инновационные возможности для глобальных разработчиков.

Internlm2.5 добился значительных улучшений в нескольких ключевых областях. Во-первых, его способность к выводу была значительно повышена, и производительность некоторых измерений даже превосходит модель Llama3-70B. Особенно в наборе математики математической оценки, Internlm2.5 достигает 100% улучшения производительности и имеет точность 60%, что сопоставимо с версией GPT-4 Turbo 1106. Этот прорывной прогресс обеспечивает более мощный инструмент для решения сложных проблем.
Во -вторых, internlm2.5 поддерживает возможности обработки контекста до 1 млн. Токенов и может обрабатывать длинные статьи в размере около 1,2 миллиона китайских иероглиф. Увеличивая длину контекста и синтетические данные, модель оптимизирована для длинного понимания документов и взаимодействия с агентом, что делает ее более удобной при работе со сложным текстом.
Кроме того, internlm2.5 также имеет возможность самостоятельно планировать и звонить в инструмент. Он может искать и интегрировать информацию с сотен веб-страниц и моделировать процессы человеческого мышления через многоагентную структуру MindSearch для эффективной интеграции сетевой информации. Эта функция предоставляет новое решение для поиска информации и интеграции знаний, значительно улучшая практичность и интеллект модели.
Разработчики могут получить больше информации и ресурсов о Internlm2.5 по следующим ссылкам:
Ссылка GitHub: https://github.com/internlm/internlm
Ссылка на модель: https://www.modelscope.cn/models/shanghai_ai_laboratory/internlm2_5-7b-chat
Ученый Puyu Home страница: https://internlm.intern-ai.org.cn/