Editor Downcodes mengetahui bahwa tim teknis Zhipu baru-baru ini meluncurkan hasil penelitian berdasarkan teknologi GLM-agen AutoGLM. Agen cerdas ini dapat mensimulasikan pengoperasian ponsel oleh manusia dan melakukan berbagai tugas sehari-hari, seperti menyukai WeChat, berbelanja di Taobao, memesan hotel di Ctrip, dll., menjadikan aplikasi AI lebih dekat dengan kehidupan sehari-hari masyarakat. Terobosan teknologinya terletak pada pemecahan banyak masalah dalam perencanaan tugas dan pelaksanaan tindakan agen model besar, dan mencapai peningkatan kinerja yang signifikan, melampaui produk pesaing lainnya dalam berbagai tolok ukur evaluasi. Kemunculan AutoGLM menandai kemajuan signifikan dalam bidang "Penggunaan Telepon" kecerdasan buatan, memberikan kemungkinan baru untuk interaksi cerdas di masa depan.
Tim teknologi Zhipu baru-baru ini meluncurkan produk baru berdasarkan hasil penelitian tim teknologi GLM - AutoGLM, yaitu agen yang dapat mensimulasikan pengoperasian ponsel oleh manusia dan melakukan berbagai tugas. Peluncuran AutoGLM menandai kemajuan kecerdasan buatan di bidang "Penggunaan Telepon", menjadikan penerapan AI lebih dekat dengan kehidupan masyarakat sehari-hari.

AutoGLM dapat melakukan berbagai tugas, seperti menyukai dan mengomentari Momen di WeChat, membeli produk pesanan historis di Taobao, memesan hotel di Ctrip, membeli tiket kereta api di 12306, memesan makanan untuk dibawa pulang di Meituan, dll. Skenario penerapannya tidak terbatas pada hal ini. Secara teori, AutoGLM dapat menyelesaikan apa pun yang dapat dilakukan manusia pada perangkat elektronik visual. Logika pengoperasiannya mirip dengan manusia, tanpa memerlukan konstruksi alur kerja yang rumit.
Saat ini, pengguna dapat merasakan AutoGLM-Web dengan menginstal plug-in "Zhipu Qingyan", yang merupakan asisten browser yang dapat menyimulasikan pengguna mengunjungi dan mengklik halaman web, dan secara otomatis menyelesaikan pengambilan lanjutan, ringkasan, dan pembuatan konten di situs web. Selain itu, AutoGLM juga telah membuka aplikasi pengujian internal pada sistem Android, dan telah melakukan kerjasama mendalam dengan produsen ponsel seperti Honor.

Teknologi AutoGLM didasarkan pada "Antarmuka Menengah Decoupling Agen Dasar" yang dikembangkan sendiri dan "Kerangka Pembelajaran Penguatan Kursus Online yang Berkembang Sendiri", yang memecahkan antagonisme kemampuan, tugas pelatihan, dan kelangkaan data dalam perencanaan tugas agen model besar dan pelaksanaan tindakan. masalah seperti sinyal umpan balik yang jarang dan penyimpangan distribusi kebijakan. AutoGLM dapat terus meningkatkan dirinya dan secara terus menerus meningkatkan kinerjanya, serupa dengan bagaimana orang terus memperoleh keterampilan baru dalam proses pertumbuhan.
Dalam hal tantangan teknis, AutoGLM memecahkan masalah kurangnya akurasi dalam "eksekusi tindakan" dan kurangnya fleksibilitas dalam "perencanaan tugas". Melalui desain "antarmuka perantara pemisahan agen dasar", ini memisahkan dua tahap "perencanaan tugas" dan "eksekusi tindakan" melalui antarmuka perantara bahasa alami, sehingga mencapai peningkatan besar dalam kemampuan agen. Pada saat yang sama, AutoGLM mengadopsi "kerangka pembelajaran penguatan kursus online yang berkembang sendiri" untuk mempelajari dan meningkatkan kemampuan agen model besar di lingkungan Web dan Telepon dalam lingkungan online nyata.
AutoGLM mencapai peningkatan kinerja yang signifikan dalam Penggunaan Telepon dan Penggunaan Browser Web, serta melampaui kinerja GPT-4o dan Claude-3.5-Sonnet pada tolok ukur evaluasi AndroidLab. Dalam tolok ukur evaluasi WebArena-Lite, AutoGLM mencapai peningkatan kinerja sekitar 200% dibandingkan GPT-4o, mempersempit kesenjangan tingkat keberhasilan antara manusia dan agen model besar dalam kontrol GUI.
Alamat proyek: https://xiao9905.github.io/AutoGLM
Secara keseluruhan, peluncuran AutoGLM merupakan terobosan penting dalam teknologi kecerdasan buatan. Hal ini tidak hanya meningkatkan kemampuan AI dalam mengoperasikan ponsel, namun juga memberikan lebih banyak kemungkinan bagi kehidupan cerdas di masa depan. Editor Downcodes berharap AutoGLM memiliki aplikasi yang lebih luas dan optimasi lebih lanjut di masa depan.