Национальная команда заканчивается! DeepSeek Tuple -Series Model вошла на национальную платформу суперкомпьютеров - AI Article

Автор：Eve Cole Время обновления：2025-02-14 09:48:02

Полная серия крупных моделей под DeepSeek официально связана с национальной суперкомпьютирующей интернет -платформой, отмечая вход новой стадии в разработке китайской индустрии Big Model Model. Этот шаг не только предоставляет домашним пользователям удобные и простые в использовании AI Big Model Services, но, что более важно, он нарушает зависимость от моделей за рубежом с закрытым исходным кодом и способствует независимым инновациям внутренней технологии ИИ. Благодаря сильной вычислительной поддержке национальной платформы суперкомпьютерной платформы, модели серии DeepSeek достигли значительного снижения затрат и поддерживают пользовательскую разработку приватизированных моделей для удовлетворения потребностей различных пользователей. Ожидается, что этот прорывной прогресс ускорит развитие Китая на уровне применения технологий ИИ и займет более благоприятную стратегическую позицию в глобальной конкуренции по ИИ.

Недавно полная серия крупных моделей, таких как DeepSeek-R1, V3 и кодировщик, была официально подключена к национальной суперкомпьютирующей интернет-платформе (www.scnet.cn). Интегрированная вычислительная система энергетической службы, China Big Model Industry, предприняла ключевой шаг.

Национальная суперкомпьютирующая интернет-платформа в настоящее время запустила версии 1,5b, 7b, 8b и 14b модели DeepSeek-R1. В ответ на потребности на уровне предприятия платформа поддерживает введение проприетарных данных для индивидуальной разработки моделей приватизации, а в ближайшем будущем также будут открыты версии с крупными параметрами, такие как 32B и 70B. Одновременный запуск вертикальных полей, таких как DeepSeek-V3, серия кодировщиков и серии математики (7b), охватывающие различные сценарии, такие как генерация кода и математические рассуждения.

По сравнению с большими моделями зарубежных, серия DeepSeek значительно снижает потребление вычислительных ресурсов посредством оптимизации алгоритмов и объединяет возможности расписания вычислительной мощности национальной платформы национальной суперкомпьютеры «включительно, простые в использовании, богатые и простые в использовании» для достижения значительного сжатия вызовов. расходы Взятие DeepSeek-R1-Distill-QWEN-7B в качестве примера, его интерфейс диалога WebUI поддерживает опыт с нулевым базой, в то время как корпоративные пользователи должны только быстро получить доступ к производственной среде через интерфейс API, формируя полную ссылку из модельных вызовов к частному развертыванию. .

Аналитики отметили, что внедрение масштабной модели DeepSeek на суперкомпьютинг-платформах может изменить текущую ситуацию, когда внутренняя индустрия ИИ опирается на модели с закрытым источником за рубежом. Поскольку все больше разработчиков обучают и оптимизируют локализованные модели на основе баз мощности по внутренним вычислителям, Китай, как ожидается, достигнет партийного «обгона» на уровне приложений технологии искусственного интеллекта, и эта волна поиска, движимая «таинственной восточной властью» вводит новые переменные.

Успешная реализация модели DeepSeek демонстрирует силу Китая в независимых инновациях в области ИИ, внедряя сильный стимул в развитие индустрии ИИ Китая, и будущее является многообещающим. Я считаю, что с постоянным развитием технологий и постоянным расширением сценариев применения DeepSeek будет больше способствовать развитию глобального искусственного интеллекта.