최근 OpenAI는 최신 언어 모델 O3에 대한 연구 보고서를 발표하여 프로그래밍 분야에서 LLMS (Large Language Model)의 상당한 발전을 보여줍니다. O3 모델은 유명한 프로그래밍 플랫폼 코드 포스에서 2724의 높은 점수를 얻었으며 세계의 99.8%에서 순위를 매겼으며 매우 잘 수행했습니다. 또한이 모델은 2024 년 국제 정보학 (IOI)에서 금메달 수준을 수상하여 프로그래밍 경쟁에서 뛰어난 능력을 발휘했습니다.

이미지 소스 참고 : 이미지는 AI에 의해 생성되며 이미지 공인 서비스 제공 업체 Midjourney
연구에 따르면 O3 모델은 이벤트를 위해 특별히 미세 조정 된 O1-IOI 모델을 넘어 IOI 대회에서 수행됩니다. 이 결과는 프로그래밍 분야에서 강화 학습의 막대한 잠재력을 보여 주며, 이는 강화 학습을 통해 훈련 된 일반 모델이 손 디자인을위한 도메인 별 솔루션을 넘어서는 것을 시사합니다. IOI 2024 이벤트에서 O3는 표준 조건에서 금메달 임계 값을 성공적으로 교차 시켰으며 동시에 코드 포스 플랫폼에서 세계 200 대 프로그래머 중 하나로 순위를 매겼으며, 최고 인간 프로그래머와 경쟁 할 수있는 강점을 보여주었습니다.
Wharton의 부교수 인 Ethan Mollick은 다음과 같이 말했습니다. 기능은 대형 일반 모델을 통해 더 나은 결과를 얻을 수 있습니다.
이 연구는 OpenAI의 경쟁 프로그래밍에서 모델의 성능과 더 넓은 소프트웨어 엔지니어링 분야에 대한 평가의 일부입니다. 한편, 또 다른 AI 회사 인 Anthropic은 이번 월요일에 AI가 직장에 미치는 영향에 대한 보고서를 발표했다. 이 보고서는 직종의 약 36%가 작업 작업의 최소 25%에서 AI를 사용하는 반면 AI 응용 프로그램의 57%가 인간 능력을 향상시키고 자동화에 43%의 초점을두고 있다고 지적합니다. 그럼에도 불구하고 직업의 4%만이 직종의 4%만이 작업 작업의 75% 이상에 사용되며, 이는 여전히 직장에서 AI를 적용 할 수있는 개발의 여지가 많음을 나타냅니다.
이 보고서는 또한 소프트웨어 개발 및 기술 쓰기가 AI 응용 프로그램의 주요 영역이며 AI는 환경과의 물리적 상호 작용과 관련된 작업에서 상대적으로 작은 역할을한다고 지적합니다. 이 발견은 다른 분야에서 AI의 적용의 차이를 보여주고 미래의 기술 개발을위한 방향을 제공합니다.
요약하면, Codeforces 및 IOI에서 O3 모델의 탁월한 성능은 프로그래밍 분야에서 강화 학습의 강력한 잠재력을 보여줍니다. 동시에, 직장에서 AI의 광범위한 사용, 특히 소프트웨어 개발 및 기술 작문 분야에서 뛰어난 성능을 발휘하면 AI 기술이 미래의 모든 생계의 변화를 계속 촉진 할 것임을 나타냅니다.