Mistral AI는 최근 Saba라는 새로운 언어 모델을 시작했으며, 이는 중동 및 동남아시아의 언어 및 문화적 차이에 대한 이해를 향상시키는 데 중점을 둡니다. 이 혁신적인 움직임은 AI 기술의 지역 적용, 특히 다국어 처리 및 문화적 적응성에서 중요한 단계입니다.
SABA 모델은 240 억 개의 매개 변수를 보유하고 있으며 많은 경쟁 업체보다 작지만 Mistral AI는 정확도를 보장하면서 더 높은 속도와 낮은 비용을 제공한다고 주장합니다. 아키텍처는 Mistral Small3 모델과 유사 할 수 있습니다. SABA는 저 성능 시스템에서 효율적으로 실행할 수 있으며 심지어 초당 150 개 이상의 토큰 속도를 달성 할 수있는 단일 GPU 설정에서도 실행할 수 있습니다. 이 효율성을 통해 SABA는 리소스 제한 환경에서 우수한 성능을 수행 할 수 있으므로 더 많은 사용자에게 편리한 AI 솔루션을 제공합니다.

이 모델은 특히 타밀어 및 말라 얄 람어와 같은 사우스 힌디어를 포함한 아랍어와 힌디어를 다루는 데 능숙합니다. Mistral AI 벤치 마크에 따르면 Saba는 아랍어로 뛰어나면서 영어와 비슷한 능력을 유지하고 있음을 보여줍니다. 이 다국어 처리 기능은 SABA가 문화 간 커뮤니케이션 및 다국어 환경에서 광범위한 응용 프로그램 전망을 갖습니다.
SABA는 아랍어 가상 어시스턴트와 에너지, 금융 시장 및 의료 부문의 전용 도구를 포함한 실제 시나리오에 적용되었습니다. 지역 관용구와 문화적 참조에 대한 이해는 특정 영역에서 효과적으로 컨텐츠를 생성 할 수 있습니다. 이 깊은 문화적 이해는 Saba가 개인화 된 서비스와 지원을 제공하는 데 잘 수행 할 수있게 해주었습니다.
사용자는 유료 API 또는 로컬 배포를 통해 SABA에 액세스 할 수 있습니다. Mistral AI의 다른 모델과 마찬가지로 Saba는 오픈 소스 모델이 아닙니다. 이 비즈니스 모델은 Mistral AI가 연구 개발에 계속 투자하고 사용자에게 고품질 제품 및 서비스를 제공 할 수 있도록합니다.

Mistral의 벤치 마크 테스트는 Saba가 아랍어로 잘 수행하고 영어 능력을 가지고 있음을 보여줍니다. 출처 : Mistral AI
SABA의 출시는 특정 지역의 언어 모델의 요구에 대한 AI 필드의 관심을 반영합니다. OpenGPT-X 프로젝트 (Teuken-7B 모델 출시), OpenAI (일본 특정 GPT-4 모델 개발) 및 Eurolingua Project (유럽 언어에 중점)과 같은 다른 조직에서도 비슷한 연구를 수행하고 있습니다. 이 추세는 전 세계 AI 개발자가 다국어 및 문화적 다양성의 과제에 적극적으로 대응하고 있으며 전 세계 AI 기술의 대중화 및 적용을 촉진하고 있음을 보여줍니다.
전통적인 대형 언어 모델은 주로 교육을 위해 많은 영어 텍스트 데이터 세트에 의존하며 특정 언어의 뉘앙스를 쉽게 무시할 수 있습니다. SABA는 이러한 격차를 메우고 지역 문화적 맥락과 일치하는보다 정확하고 더 많은 언어 처리 기능을 제공하는 것을 목표로합니다. 이 대상 디자인은 SABA가 특정 언어 및 문화 환경에서 잘 수행하여 사용자에게보다 정확하고 개인화 된 서비스를 제공합니다.