프린스턴 대학교는 GPT-4 기술을 기반으로 하고 GitHub 리포지토리의 버그를 자동으로 수정할 수 있는 세계 최초의 오픈 소스 AI 프로그래머 SWE-agent를 출시했습니다. SWE-agent는 SWE-bench 테스트 세트에서 좋은 성능을 발휘하여 문제의 12.29%를 성공적으로 해결했으며, 평균 93초 만에 기존 AI 프로그래머와 비교할 수 있는 정확도를 갖췄습니다. 오픈 소스 특성으로 인해 빠르게 많은 관심을 끌 수 있었고 소프트웨어 엔지니어링 분야에서 AI의 엄청난 잠재력을 입증했습니다. 이 기사에서는 미래 소프트웨어 엔지니어링에 대한 SWE 에이전트의 작동 원리, 성능 및 영향을 자세히 살펴보겠습니다.
프린스턴 대학교는 최근 세계 최초의 오픈 소스 AI 프로그래머인 SWE-agent라는 AI 프로그래머를 출시했습니다. 이 프로그래머는 GPT-4 기술을 기반으로 하며 GitHub 리포지토리의 버그를 자동으로 수정할 수 있습니다. 에이전트-컴퓨터 인터페이스의 탄생은 소프트웨어 엔지니어링 분야에서 AI를 적용하는 데 있어 중요한 단계입니다. SWE-벤치 테스트 세트에서 SWE-agent의 성능은 인상적이었습니다. 평균 93초 만에 문제의 12.29%를 성공적으로 해결했으며 그 정확도는 이전에 출시된 AI 프로그래머 Devin과 비슷했습니다. SWE 에이전트의 오픈 소스 특성은 GitHub에서 별 1600개와 포크 109개를 빠르게 얻었음을 의미하며, 이는 이 기술에 대한 오픈 소스 커뮤니티의 높은 인지도와 관심을 보여줍니다. SWE 에이전트는 파일을 열고, 스크롤하고, 검색하고, 특정 줄을 편집하고, 자동으로 구문 확인을 수행하고, 테스트를 작성 및 실행할 수 있는 특수 터미널과 상호 작용하여 작동합니다. 이 디자인은 인간을 위해 설계된 UI와 유사하여 오류를 방지하고 피드백을 제공합니다. 예를 들어, 행렬 연산 버그를 처리할 때 SWE-agent는 문제를 재현하고, 문제 코드를 찾고, 수정하고, 문제를 성공적으로 해결할 수 있습니다. 프린스턴 대학교 연구진은 SWE-agent에 대한 간결한 지침 및 피드백 형식을 설계하여 모델이 코드 저장소를 탐색하고, 코드 파일을 보고, 편집하고, 실행할 수 있도록 했습니다. SWE 에이전트의 워크플로는 추론과 평가의 두 단계로 나뉩니다. 추론 단계에서 SWE 에이전트는 GitHub의 문제를 처리하고 평가 단계에서 복구 솔루션을 생성하며 솔루션이 실제로 문제를 해결하는지 확인합니다. 이 연구의 핵심 저자인 John Yang과 Carlos E. Jimenez는 모두 프린스턴 대학의 연구 조교이자 박사 과정 학생입니다. 그들의 연구 관심 분야는 언어 기초, 상호 작용, LLM 벤치마킹, 소프트웨어 엔지니어링 및 코드 생성에 중점을 두고 있습니다. 그들의 작업은 소프트웨어 엔지니어링 분야에서 AI의 잠재력을 보여주고 엔지니어링 프로세스에서 AI와 인간의 역할과 역량에 대한 심층적인 사고를 촉발합니다. AI 기술의 발전으로 프로그래밍 분야에서도 AI의 발전을 목격했습니다. 복잡한 엔지니어링 작업을 계획하고 실행할 수 있을 뿐만 아니라 버그를 수정하고 전체 프로젝트 개발 프로세스를 담당할 수도 있습니다. 그러나 AI가 보안 코드를 작성하는 데 있어 진전이 있었음에도 불구하고 인간의 감독은 여전히 중요합니다. AI의 부상은 아직 소프트웨어 엔지니어를 완전히 대체하는 단계에는 이르지 못했지만 기술 분야의 모습과 미래 방향을 바꾸고 있다. 프린스턴 팀의 이 오픈소스 AI 프로그래머는 소프트웨어 엔지니어링 분야에 새로운 연구와 응용 가능성을 제시할 뿐만 아니라 미래를 창조하기 위한 인공지능과 인간의 협력에 대해 생각해 볼 수 있는 기회를 제공합니다. 기술이 계속 발전함에 따라 소프트웨어 엔지니어링 분야에서 AI가 훨씬 더 중요한 역할을 하는 것을 볼 수 있습니다.SWE 에이전트의 출현은 AI 지원 프로그래밍의 새로운 이정표를 의미합니다. 비록 인간의 감독이 여전히 필요하지만 개발 효율성과 코드 품질을 향상시키는 잠재력은 무시할 수 없습니다. 미래에는 AI와 인간 프로그래머의 협업이 소프트웨어 엔지니어링 분야의 주류 트렌드가 되어 공동으로 기술 발전을 촉진할 것입니다.