12 명 이상의 이전 Google Deepmind Scientists가 공동 설립 한 회사 인 Reka AI는 최근 첫 번째 오픈 소스 모델 인 Reka Flash3를 발표했습니다. 210 억 개의 매개 변수를 가진이 추론 모델이 시작되면 업계의 광범위한 관심을 끌었습니다.
공식 보고서에 따르면 REKA Flash3의 매개 변수 척도는 210 억에 불과하지만이 모델은 처음부터 훈련 된 일반적인 추론 모델입니다. 다양한 합성 및 공개 데이터 세트에서 감독 된 미세 조정을 수행 할뿐만 아니라 모델 및 규칙 기반 강화 학습 (RLOO)을 통해 깊이 최적화합니다.

이 "내부 및 외부"훈련 방법을 사용하면 REKA Flash3가 성능의 놀라운 강도를 보여줄 수 있었으며, 명령 A 및 GEMMA327B와 같은 더 큰 매개 변수를 가진 모델을 능가했습니다.
더 흥미로운 점은 REKA Flash3가 같은 규모의 오픈 소스 모델 중 리더로 환영 받는다는 것입니다. 이는 개발자가 마침내 다양한 혁신적인 응용 프로그램을보다 자유롭게 탐색하고 구축 할 수있는 강력하고 무료 "핸드 무기"를 가지고 있음을 의미합니다.
REKA Flash3의 기능은 단순한 텍스트 생성 이상의 것입니다. 그 뒤에는 많은 흥미로운 기능적 기능이 있습니다.
첫째, 일반적인 추론 모델로서 REKA Flash3는 논리적 추론에서 잘 수행됩니다. 복잡한 질문에 대답하든 다중 단계 추론을 수행하든 "스마트"측면을 보여줄 수 있습니다.
둘째, 공무원은 REKA Flash3가 낮은 대기 시간 모델이며 장치에 배치에 매우 적합하다고 강조했습니다. 이는 향후 휴대폰 및 태블릿과 같은 터미널 장치 에서이 강력한 모델로 가져온 편리한 서비스를 직접 경험할 수 있음을 의미합니다. 이것은 단순히 "효율성 우선"시대의 축복입니다!
또한 REKA Flash3는 독립적 인 모델 일뿐 만 아니라 REKA AI의 새로운 플랫폼 Nexus의 핵심 원동력이기도합니다. Nexus 플랫폼은 조직이 웹 페이지를 탐색하고 코드를 실행하며 문서, 이미지, 비디오 및 오디오를 포함한 내부 파일을 분석 할 수있는 심층적 인 연구 기능으로 AI 작업자를 만들고 관리 할 수 있도록 설계되었습니다.
reka flash3는 출력을 생성하기 전에 "생각"하고 특정 태그를 사용하여 사고 과정의 시작과 끝을 표시합니다. 흥미롭게도, REKA AI는 또한 특정 수의 사고 단계 후에 사용자가 출력을 강요 할 수있는 "예산 필수"메커니즘을 제공하며, 이는 일반적으로 사고가 완료되지 않더라도 합리적인 결과를 낳습니다.
REKA Flash3의 뛰어난 기능에도 불구하고 공무원은 또한 소규모 모델로서 지식 집약적 인 작업에 가장 적합한 선택이 아니라고 지적했습니다. 이러한 유형의 수요에 대해 REKA AI는 웹 검색과 같은 도구와 함께 REKA Flash3를 사용하여 모델에 더 넓은 지식 소스를 제공 할 것을 권장합니다.
모델 : https://top.aibase.com/tool/reka-flash-3