DeepSeek은 공식적으로 Zhihu 플랫폼에서 공식 계정을 개설하고 "DeepSeek-V3/R1 추론 시스템의 개요"를 발표했습니다. 이 기사는 모델 추론 시스템의 최적화 세부 사항과 비용 분기 마진 정보를 처음으로 공개하여 "Deepseek Open Source Week"의 성공적인 끝을 표시합니다. 이러한 움직임은 기술 분야에서 Deepseek의 깊은 축적을 보여줄뿐만 아니라 업계에 대한 귀중한 참조를 제공합니다.

이 기사는 DeepSeek-V3/R1 추론 시스템의 심층적 인 두 가지 핵심 최적화 목표를 소개합니다 : "더 큰 처리량과 낮은 대기 시간". 이러한 목표를 달성하기 위해 DeepSeek은 대규모 크로스 노드 전문가 병렬 처리 (EP) 기술을 채택하지만,이 기술은 시스템의 복잡성을 증가시킵니다. 이 기사는 EP 기술을 사용하여 배치 크기를 늘리고 전송 시간을 숨기고로드 밸런싱을 달성하여 시스템의 전반적인 성능을 크게 향상시키는 방법에 중점을 둡니다.
특히 DeepSeek은 비용 및 이익 마진 데이터를 거의 공개하지 않습니다. "GPU 임대 비용이 시간당 US $ 2라고 가정하면 총 비용은 하루에 $ 87,072입니다. 모든 토큰이 DeepSeek R1의 가격 책정에 따라 계산되면 하루의 이론적 총 수익은 $ 562,027이며 비용의 이익은 545%입니다. 업계에 대한 귀중한 참조 및 참조.