Elon Musk의 인공 지능 회사 인 Xai는 이번 월요일 최신 언어 모델 Grok3를 발표했으며, 이는 인공 지능 분야에서 회사가 한 상당한 진전을 보여줍니다. 머스크는 기자 회견에서 새로운 모델이 약 200,000 GPU를 장착하여 모델에 대한 강력한 컴퓨팅 전력 지원을 제공하는 멤피스 기반 데이터 센터 덕분에 전임자의 컴퓨팅 전력의 10 배를 가지고 있다고 밝혔다.
Grok3 시리즈 모델은 속도를 높이면서 정확도의 일부를 희생하는 간소화 된 버전을 포함하여 다양한 변형을 시작했습니다. 또한 새로 출시 된 "추론"모델은 수학 및 과학적 문제를 해결하도록 특별히 설계되었으며 사용자는 Grok 인터페이스의 "Think"및 "Brain"설정을 통해 이러한 기능을 조정할 수 있습니다. Xai는이 버전이 아직 완성되지 않았으며 모델은 여전히 지속적으로 훈련을 받고 있으며 팀은 앞으로 몇 주 안에 추가 개선 및 최적화를 계획하고 있다고 말했다.
AI 벤치마킹 플랫폼 Lmarena.ai에 따르면 Grok3는 챗봇 필드에서 1,400 명 이상을 기록하여 필드의 리더가되었습니다. 프로그래밍, OpenAi, Anthropic 및 Google 모델을 능가하는 것과 같은 모든 범주에서 탁월합니다. 그러나 실제 성능은 벤치 마크 결과와 다를 수 있습니다. 예를 들어, Claude3.5sonnet은 코딩 벤치 마크의 일부 모델보다 점수가 낮지 만 많은 사용자가 여전히 프로그래밍 작업에 더 나은 선택이라고 생각합니다.
Openai 설립자 Andrej Karpathy는 Grok3에 조기 접근을 받았으며 모델의 논리적 추론 능력을 높이 평가했습니다. Karpasi는 "Think"기능은 GPT-2 훈련 플롭 계산 또는 보드 게임을위한 육각형 메쉬 생성과 같은 복잡한 작업을 성공적으로 처리 할 수 있으며 이전에는 OpenAI의 고급 모델로만 제한되었습니다. 또한이 기능은 문자 계산 및 소수의 비교와 같은 기본 수학 연산의 정확도를 향상시킵니다.
새로운 검색 기능 측면에서 Karpasi는 DeepSearch의 품질이 Perplexity의 연구 도구와 비교하여 다가오는 Apple 제품 및 Palantir Stock Dynamics와 같은 주제에 대한 관련 답변을 제공한다고 지적했습니다. 그러나 그는 또한 몇 가지 명백한 문제를 발견했습니다.이 모델은 때때로 가짜 URL을 생성하고, 지원되지 않는 진술을하고, 특정 프롬프트에서 X의 게시물 만 인용합니다.
또한 Grok3는 또한 존재에 대한 인식이 부족하여 주요 AI 실험실에서 Xai의 위치를 놓치고 있습니다. 이러한 한계는 아직 Openai“Deep Research”의 품질 수준에서 DeepSearch를 남겼으며 유머와 윤리적 문제에 대해 성과가 저조했습니다. 그럼에도 불구하고 Grok3의 출시는 여전히 인공 지능 분야에서 Xai의 강력한 강점과 혁신 능력을 보여줍니다.