Downcodes의 편집자는 Zhipu 기술팀이 최근 GLM 기술인 AutoGLM 에이전트를 기반으로 한 연구 결과를 출시했다는 사실을 알게 되었습니다. 이 지능형 에이전트는 인간의 휴대폰 작동을 시뮬레이션하고 WeChat 좋아요, Taobao 쇼핑, Ctrip 호텔 예약 등과 같은 다양한 일상 작업을 수행하여 AI 애플리케이션을 사람들의 일상 생활에 더 가깝게 만들 수 있습니다. 이 제품의 기술적 혁신은 대형 모델 에이전트의 작업 계획 및 작업 실행과 관련된 많은 문제를 해결하고, 여러 평가 벤치마크에서 다른 경쟁 제품을 능가하는 상당한 성능 개선을 달성한 데 있습니다. AutoGLM의 출현은 인공 지능의 "전화 사용" 분야에서 중요한 진전을 의미하며 미래의 지능형 상호 작용을 위한 새로운 가능성을 제공합니다.
Zhipu 기술팀은 최근 GLM 기술팀의 연구 결과를 바탕으로 신제품인 AutoGLM을 출시했습니다. AutoGLM은 휴대폰의 인간 작동을 시뮬레이션하고 다양한 작업을 수행할 수 있는 에이전트입니다. AutoGLM의 출시는 '전화 사용' 분야에서 인공지능의 발전을 의미하며, AI 적용이 사람들의 일상생활에 더욱 가까워지고 있음을 의미합니다.

AutoGLM은 WeChat의 Moments에 좋아요 및 댓글 달기, Taobao에서 과거 주문 상품 구매, Ctrip에서 호텔 예약, 12306에서 기차표 구매, Meituan에서 테이크아웃 주문 등 다양한 작업을 수행할 수 있습니다. 이론적으로 AutoGLM은 복잡한 작업 흐름 구성 없이 인간이 시각적 전자 장치에서 수행할 수 있는 모든 작업을 완료할 수 있습니다.
현재 사용자는 웹 페이지 방문 및 클릭을 시뮬레이션하고 웹 사이트에서 고급 검색, 요약 및 콘텐츠 생성을 자동으로 완료할 수 있는 브라우저 도우미인 "Zhipu Qingyan" 플러그인을 설치하여 AutoGLM-Web을 경험할 수 있습니다. 또한, AutoGLM은 안드로이드 시스템에서 내부 테스트 애플리케이션도 오픈했으며, Honor 등 휴대폰 제조업체와 심도 있는 협력을 진행해왔다.

AutoGLM의 기술은 Zhipu가 자체 개발한 "Basic Agent Decoupling Intermediate Interface"와 "Self-evolving Online Course Reinforcement Learning Framework"를 기반으로 하며, 이는 대형 모델 에이전트 작업 계획 및 행동 실행에서 능력 대립, 훈련 작업 및 데이터 부족 문제를 해결합니다. 희박한 피드백 신호 및 정책 분포 드리프트와 같은 문제. AutoGLM은 사람들이 성장 과정에서 계속해서 새로운 기술을 습득하는 방식과 유사하게 스스로를 지속적으로 개선하고 자체 성능을 지속적으로 꾸준히 향상시킬 수 있습니다.
기술적 과제 측면에서 AutoGLM은 "작업 실행"의 정확성이 부족하고 "작업 계획"의 유연성이 부족한 문제를 해결합니다. "기본 에이전트 분리 중간 인터페이스" 설계를 통해 "작업 계획"과 "작업 실행"의 두 단계를 자연어 중간 인터페이스를 통해 분리하여 에이전트의 성능을 크게 향상시킵니다. 동시에 AutoGLM은 실제 온라인 환경에서 웹 및 전화 환경의 대형 모델 에이전트의 기능을 학습하고 향상시키기 위해 "자체 진화하는 온라인 코스 강화 학습 프레임워크"를 채택합니다.
AutoGLM은 전화 사용과 웹 브라우저 사용 모두에서 상당한 성능 향상을 달성했으며 AndroidLab 평가 벤치마크에서 GPT-4o 및 Claude-3.5-Sonnet의 성능을 능가했습니다. WebArena-Lite 평가 벤치마크에서 AutoGLM은 GPT-4o에 비해 약 200% 성능 향상을 달성하여 GUI 제어에서 인간과 대규모 모델 에이전트 간의 성공률 격차를 줄였습니다.
프로젝트 주소: https://xiao9905.github.io/AutoGLM
전체적으로 AutoGLM의 출시는 인공 지능 기술의 중요한 혁신을 의미합니다. 이는 AI의 휴대폰 작동 능력을 향상시킬 뿐만 아니라 미래의 지능적 삶에 더 많은 가능성을 제공합니다. Downcodes의 편집자는 AutoGLM이 앞으로 더 폭넓은 응용 프로그램과 추가 최적화를 갖기를 희망합니다.