Microsoft는 최근 Windows 운영 체제 인 Omniparser -V2.0에서 업그레이드 된 Big Model Omniparser 버전을 출시했습니다. 이 새로운 버전은 기술의 주요 획기적인 발전을 달성 할뿐만 아니라 데스크탑 및 창 요소를 식별하고 상호 작용할 수 있습니다. 이 진행 상황은 AI 에이전트 기술에서 완전 자동 컴퓨터 사용을 달성하는 데 중요한 단계가되어 향후 지능형 사무실 및 자동화 된 운영에 새로운 가능성을 제공합니다.
Omniparser-V2.0의 핵심 기능은 데스크탑 환경을 인식하고 상호 작용할 수있는 능력에 있습니다. 이 모델과 결합하여 AI 에이전트는 사용자 지침을 이해할뿐만 아니라 Windows 운영 체제 수준에서 직접 작업을 수행 할 수 있습니다. 예를 들어, 특정 창을 열고, 찾아서 버튼을 클릭하고, 텍스트를 입력하는 등을 입력 할 수 있습니다. 이 능력 개선은 AI 에이전트의 성능을 실제 응용 프로그램에서 더 똑똑하고 효율적으로 만들어 사용자가보다 편리한 운영 경험을 제공합니다.
Omniparser-v2.0은 확장 성이 강하고 DeepSeek-R1과 같은 다른 모델에 액세스 할 수 있다고 언급 할 가치가 있습니다. 이 유연성은보다 강력하고 유연한 AI 에이전트를 구축 할 수있는 가능성을 제공하고 미래의 기술 개발을위한 새로운 공간을 열어줍니다. Omniparser-V2.0은 다른 모델과 결합하여보다 복잡한 시나리오의 요구를 충족시키기 위해 기능과 성능을 더욱 향상시킬 수 있습니다.
업계 내부자들은 일반적으로 Omniparser-V2.0과 같은 도구의 출현으로 AI 에이전트의 다운 스트림 도구 체인이 점점 더 완벽 해지고 있다고 생각합니다. 운영 브라우저에서 운영 운영 체제에 이르기까지 AI 에이전트 기능의 범위는 계속 확장되어 AI가 향후 자동화 된 사무실 및 개인 비서의 분야에서 더 큰 역할을 할 것임을 나타냅니다. 우리는 점차 AI 구동, 더 똑똑하고 효율적인 컴퓨팅 시대에 점차 다가오고 있으며 미래의 기술 개발이 더욱 흥미로울 것입니다.
Omniparser-V2.0의 출시는 AI 분야의 Microsoft에게 중요한 획기적인 혁신 일뿐 만 아니라 전체 산업에 새로운 영감을주는 것입니다. 기술의 지속적인 발전으로 AI 에이전트의 응용 시나리오가 더 광범위 할 것이며 일상 생활과 업무에서의 역할이 점점 더 중요해질 것입니다. 우리는 AI 기술의 추가 개발을 촉진하기 위해 미래에 더 유사한 혁신적인 기술을 볼 수 있기를 기대합니다.
주소 : https://huggingface.co/microsoft/omniparser-v2.0