중국 인공 지능 스타트 업 Deepseek은 최근 인공 지능 산업에서 광범위한 관심을 끌고있는 최신 대규모 언어 모델 인 DeepSeek-V3-0324를 조용히 발표했습니다. 이 모델은 AI Resource Library에 641GB의 얼굴 포옹 얼굴에 나타납니다. 대규모 홍보를 수행하지 않으며 빈 readme 파일과 모델 가중치 만 제공됩니다.
이 모델은 MIT와 함께 라이센스가 부여되어 상업용 목적으로 무료로 사용할 수 있으며 M3 Ultra Chip이있는 Apple Mac Studio와 같은 소비자 등급 하드웨어에서 직접 실행할 수 있습니다. AI 연구원 Awni Hannun은 소셜 미디어에서 DeepSeek-V3-0324의 4 비트 정량적 버전이 512GB M3 Ultra Chip에서 초당 20 개보다 빠르게 실행된다고 밝혔다. Mac Studio의 높은 가격에도 불구하고, 이러한 대규모 모델을 실행할 수 있다는 것은 데이터 센터에 대한 Top AI의 이전 의존성을 국소 적으로 깨뜨립니다.

DeepSeek-V3-0324는 작업을 수행 할 때 6 억 6 천만 개의 매개 변수 대신 약 370 억 매개 변수 만 활성화하여 효율성을 크게 향상시키는 하이브리드 전문가 (MOE) 아키텍처를 채택합니다. 동시에이 모델에는 긴 잠재적 인 관심 (MLA) 및 MTP (Multi-Token Prediction) 기술이 포함되어 있습니다. MLA는 긴 텍스트에서 모델의 상황에 맞는 이해 능력을 향상시킵니다. MTP를 통해 모델은 한 번에 여러 토큰을 생성 할 수 있으며 출력 속도는 거의 80%증가합니다. 4 비트 양자화 된 버전은 스토리지 수요를 352GB로 줄여 고급 소비자 등급 하드웨어에서 실행할 수 있습니다.
초기 테스터에 따르면 DeepSeek-V3-0324는 이전 버전에 비해 크게 개선되었습니다. AI 연구원 Xeophon 은이 모델이 모든 테스트 메트릭에서 큰 도약을했으며 Anthropic의 Claude Sonnet 3.5를 능가하여 최고의 비 주제 모델이되었습니다. 또한 구독 해야하는 Sonnet과 달리 DeepSeek-V3-0324의 무게를 무료로 다운로드 할 수 있습니다.

DeepSeek의 오픈 소스 릴리스 전략은 서부 AI 회사와 대조적입니다. 미국의 OpenAI와 Anthropic은 모델에 대한 지불 임계 값을 설정 한 반면 중국 AI 회사는 점점 더 오픈 소스 라이센스를 느슨하게하는 경향이 있습니다. 이 전략은 중국 AI 생태계의 발전을 가속화했으며 Baidu, Alibaba 및 Tencent와 같은 기술 대기업도 소송을 따라 오픈 소스 AI 모델을 발표했습니다. NVIDIA 칩 제한에 직면 한 중국 기업들은 효율성과 최적화를 강조함으로써 그들의 단점을 경쟁 우위로 전환했습니다.
DeepSeek-V3-0324는 다가오는 DeepSeek-R2 추론 모델의 기초 일 가능성이 높습니다. 현재의 추론 모델 컴퓨팅 수요는 엄청납니다. DeepSeek-R2가 잘 수행되면 OpenAI의 소문 GPT-5에 직접적인 도전을 할 것입니다.
DeepSeek-V3-0324를 경험하고자하는 사용자와 개발자의 경우 전체 모델 가중치를 Hugging Face에서 다운로드 할 수 있지만 파일은 크며 높은 저장 및 컴퓨팅 리소스가 필요합니다. 무료 API 액세스 및 친숙한 채팅 인터페이스를 제공하는 OpenRouter와 같은 클라우드 서비스를 선택할 수도 있습니다. DeepSeek의 자체 채팅 인터페이스도 새로운 버전을 지원하도록 업데이트되었을 수 있습니다. 개발자는 또한 과장된 실험실과 같은 추론 서비스 제공 업체를 통해 모델을 통합 할 수 있습니다.
DeepSeek-V3-0324는 인간과 같은 대화 스타일에서보다 공식적이고 기술적 인 스타일로 커뮤니케이션 스타일로 바뀌 었음을 주목할 가치가 있습니다. 이러한 변화는 전문 및 기술 응용 프로그램 시나리오에 적응하기위한 것이지만 소비자 지향 응용 프로그램에서의 호소에 영향을 줄 수 있습니다.
DeepSeek의 오픈 소스 전략은 글로벌 AI 환경을 재구성하고 있습니다. 이전에는 미국과의 중국의 AI 격차가 1-2 년이 지났지 만 이제는 3-6 개월로 크게 좁아졌으며 일부 지역은 따라 잡았습니다. 안드로이드 시스템이 오픈 소스를 통해 글로벌 지배력을 얻는 것처럼, 오픈 소스 AI 모델은 광범위한 응용 프로그램 및 개발자의 집단 혁신과 경쟁 할 것으로 예상되며 AI 기술의 광범위한 응용을 홍보 할 것으로 예상됩니다.