2025 년 3 월 24 일, 중국 인공 지능 연구 기관인 Deepseek은 미리보기없이 Hugging Face 플랫폼에서 DeepSeek-V3-0324의 최신 버전의 플래그십 언어 모델을 발표했습니다. 이 "낮은 키와 강력한"업데이트는 기술 커뮤니티에서 격렬한 토론을 빠르게 촉발 시켰으며 많은 개발자와 AI 애호가들은 초기 경험과 기대를 공유했습니다. 다음은 기술 커뮤니티의 피드백을 기반으로 한 심층적 인 보고서입니다.

1. 신비한 릴리스 : 685 억 파라미터 Behemoth가 조용히 공개되었습니다.
DeepSeek은 일관된 로우 키 스타일을 유지합니다. The Technology Community에 따르면, 새로운 모델은 공식 발표 나 기자 회견없이 3 월 24 일 아침 일찍 포옹 얼굴에 조용히 살았습니다. 새 버전은 685 억 5 천만 파라미터에 도달했으며 작년 12 월에 발표 된 DeepSeek-V3 기술 논문은 671 억 매개 변수입니다. 이 차이는 잠재적 아키텍처 조정에 대한 추측을 일으켰습니다. 공무원은 상세한 기술 매개 변수를 공개하지 않았지만,이 "갑작스런 공격"은 지역 사회를 자극하기에 충분합니다.
다수의 메시지는 DeepSeek이 그룹 메시지를 통해 업그레이드 만 통지했음을 확인했으며, 이는 모든 사람이 무료로 다운로드하기 위해 포옹 얼굴에 모델이 공개되었음을 나타냅니다. 이 보고서는 또한 타사 플랫폼이 API 지원을 신속하게 제공하여 커뮤니티의 새로운 모델에 대한 빠른 반응을 보여 주었다고 지적했다.

2. 성능 도약 : 수학 및 프로그래밍 기능의 상당한 개선
이 업데이트의 핵심 하이라이트는 성능이 크게 향상된다는 것입니다. 회사는이를 "소규모 버전 업데이트"로 배치했지만 예비 테스트는 수학적 기능과 프론트 엔드 설계에서 크게 개선되었습니다. 몇몇 기술 검토 자들은 모델의 프로그래밍 기능이 Claude 3.5 수준에 가까워 졌다고보고했습니다. 일부 검토 자들은 v3-0324에 의해 생성 된 샘플 이미지를 공유하여 초기 효과가 "매우 좋았다"고 말합니다.

또한 초기 피드백은 기술 작업의 개선 외에도 새로운 모델이보다 인간화 된 대화 경험을 제공 할 수 있다고 제안합니다. 그러나 당국에 의해 벤치 마크 데이터가 공개되지 않았으므로 이러한 예비 평가에는 추가 검증이 필요합니다.
3. 새로운 오픈 소스 태도 : 커뮤니티는 MIT 프로토콜에 따라 열정적으로 대응했습니다.
이전 버전과 달리 DeepSeek-V3-0324는보다 편안한 MIT 오픈 소스 프로토콜을 채택하며, 이는 긍정적 인 개발로 널리 알려진 변화입니다. 기술 논평자들은 프로그래밍 기능의 크게 향상된 것 외에도이 모델은보다 오픈 오픈 소스 프로토콜을 채택한다고 지적했다. 이 모델은 이제 오픈 소스 플랫폼에서 685 억 5 천만 개의 매개 변수량으로 제공되며, Open Source 커뮤니티에 대한 DeepSeek의 열린 태도를 반영합니다.
Hugging Face Comment 섹션의 따뜻한 반응은이 관찰을 확인합니다. 오픈 소스 및 성능 개선의 이중 장점은 DeepSeek-V3-0324를 잠재적 인 산업 체인저로 간주하고 OpenAI GPT-4O 또는 Anthropic Claude 3.5 Sonnet과 같은 폐쇄 소스 모델의 상태에 도전 할 수 있습니다.
4. 사용자 경험 : 공식 웹 사이트에서 API로 원활한 전환

OpenRouter 플랫폼이 API 인터페이스를 열었습니다
DeepSeek은 또한이 업데이트에서 사용자 경험을 최적화했습니다. 기술 보고서에 따르면, 사용자는 공식 웹 사이트의 "심층 사고"기능 만 v3-0324 버전을 직접 사용하기 만하면 API 인터페이스 및 사용 방법은 변경되지 않습니다. 이 완벽한 스위칭 설계는 사용의 임계 값을 낮추고 커뮤니티에서 호평을 받았습니다.
이 보고서는 또한 타사 플랫폼이 API 액세스를 제공하여 생태계의 빠른 적응성을 보여 주었다는 점을 지적했다.
5. Future Outlook : R2에 대한 전주?
"소규모 버전 업그레이드"로 표시되지만이 업데이트의 영향은 기대치를 훨씬 능가합니다. 기술 커뮤니티의 많은 사람들은 이것이 다가오는 Deepseek-R2의 길을 열어 놓는지 여부를 추측합니다. 이전에는 DeepSeek의 R1 모델이 논리적 추론 및 수학적 작업에서 OpenAI의 O1 모델과 경쟁했으며 V3-0324의 출시는 차세대 추론 모델의 축적을위한 기술적 기초로 간주되었습니다. DeepSeek은 R2의 특정 출시 날짜를 확인하지 않았지만 커뮤니티 기대치가 분명히 가열되고 있습니다.
6. 요약 : 낮은 키의 강한 상승
DeepSeek-v3-0324의 출시는 회사의 일반적인 스타일 인 Low-Key 릴리스 및 우수한 성능을 계속합니다. 685 억 개의 매개 변수의 규모에서 MIT 프로토콜의 오픈 소스 전략에 이르기 까지이 모델은 의심 할 여지없이 AI 분야에 새로운 활력을 주입했습니다. 한 기술 검토자가 설명했듯이 : "표면은 키가 낮지 만 실제로는 호랑이만큼 강력합니다." 기술적 인 세부 사항이 완전히 공개되기 전에도 개발자와 연구원들은이 "침묵 짐승"의 잠재력을 최대한 활용하기 위해 테스트에 참가하기를 간절히 원했습니다.
더 많은 검토 결과가 발표되면서 DeepSeek-V3-0324가 기존 AI 환경을 진정으로 흔들 수 있는지 여부는 앞으로 몇 주 안에 주목을 받고 있습니다. 확실히, DeepSeek은 글로벌 AI 경쟁에서 독특한 방식으로 꾸준히 움직이고 있습니다.