DeepSeek официально открыл официальный аккаунт на платформе Zhihu и выпустил техническую статью «Обзор системы вывода DeepSeek-V3/R1». В этой статье впервые раскрывают детали оптимизации и информацию о ценной марже своей системы вывода моделей, отмечая успешный конец высокопроизводимой «Deepseek Open Source Week». Этот шаг не только демонстрирует глубокое накопление DeepSeek в области технологий, но также обеспечивает ценную ссылку для отрасли.

В статье вводится глубинные две основные цели оптимизации системы вывода DeepSeek-V3/R1: «большая пропускная способность и более низкая задержка». Для достижения этих целей DeepSeek принимает крупномасштабную технологию экспертов по перекрестному узлу (EP), хотя эта технология увеличивает сложность системы. Статья посвящена тому, как использовать технологию EP для увеличения размера партии, скрыть время передачи и достижение балансировки нагрузки, тем самым значительно улучшив общую производительность системы.
Особо следует отметить, что Deepseek редко раскрывает свои данные о стоимости и прибыли. В статье раскрыта: «Предполагая, что стоимость аренды графических данных составляет 2 долл. США в час, общая стоимость составляет 87 072 долл. США в день. Если все токены рассчитываются в соответствии с ценой DeepSeek R1, теоретический общий доход в день составляет 562 027 долл. США, а затратная прибыль - 545%. Ссылка и ссылка на отрасль.