Объятие лица запустило новую компактную языковую модель Smollm2, которая является захватывающим прорывом. Smollm2 имеет три разных версии размера параметров, которые обеспечивают мощную производительность даже на устройствах с ограниченными ресурсами, что имеет большое значение для приложений по поводу вычислений и мобильных устройств. Он превосходит несколько тестов, превосходя аналогичные модели, демонстрируя свои преимущества в научных рассуждениях и задачах здравого смысла. Открытый исходный код Smollm2 и лицензия Apache 2.0 также облегчают доступ к доступу и применению.
Объятие Face Today выпустила Smollm2, новый набор компактных языковых моделей, которые достигают впечатляющей производительности, в то же время требуя гораздо меньше вычислительных ресурсов, чем крупные модели. Новая модель выпускается по лицензии Apache 2.0 и поставляется в трех размерах - параметры 135 м, 360 м и 1,7B - подходящие для развертывания на смартфонах и других устройствах с ограниченной обработкой и памятью.

Модель SmollM2-1B превосходит модель Meta Llama1b в нескольких ключевых контрольных показателях, особенно в научных рассуждениях и задачах здравого смысла. Эта модель превосходит большие конкурирующие модели по большинству когнитивных критериев, используя разнообразную комбинацию наборов данных, включая FineWeb-EDU и специализированные математические и кодирующие наборы.
Запуск SMOLLM2 состоится в критический момент, когда индустрия ИИ пытается справиться с необходимостью вычислений для запуска больших языковых моделей (LLMS). В то время как такие компании, как Openai и Anpropic, продолжают раздвигать границы размера модели, наблюдается все больше признания необходимости эффективного, легкого искусственного интеллекта, который может работать локально на устройствах.

Smollm2 предлагает другой подход к предоставлению мощных возможностей ИИ непосредственно к персональным устройствам, указывая на будущее, где больше пользователей и компаний могут использовать расширенные инструменты искусственного интеллекта, а не только технологические гиганты с огромными центрами обработки обработки данных. Эти модели поддерживают ряд приложений, включая переписывание текста, резюме и вызовы функций, подходящие для развертывания в сценариях, где конфиденциальность, задержка или ограничения подключения делают облачные решения AI непрактичными.
Хотя эти меньшие модели все еще имеют ограничения, они представляют собой часть широкой тенденции в более эффективных моделях ИИ. Выпуск SMOLLM2 показывает, что будущее искусственного интеллекта может принадлежать не только к более крупным моделям, но и более эффективным архитектурам, которые могут обеспечить мощную производительность с меньшим количеством ресурсов.
Появление SMOLLM2 открыло новые возможности для легких приложений искусственного интеллекта, что указывает на то, что технология искусственного интеллекта будет более широко использоваться в различных устройствах и сценариях, что привлекло пользователям более удобный и эффективный опыт. Его функции с открытым исходным кодом также способствовали дальнейшему развитию и инновациям сообщества ИИ. В будущем мы должны увидеть более эффективные и компактные модели ИИ, способствующие популяризации и развитию технологий искусственного интеллекта.