Die erste Tasse Kaffee in diesem Herbst wurde vom intelligenten Agenten bestellt.
Ab September können die KI-App Zhi Xiaobao von Alipay und das intelligente AutoGLM von Zhipu Benutzern dabei helfen, einen rohen Kokosnuss-Latte mit weniger Zucker und ohne Eis zu bestellen. Honor startete sogar einen großen Schritt und ließ den intelligenten YOYO 2.000 Tassen auf einmal bestellen.
Wenn Multimodalität einen Agenten mit „Augen“ und „Ohren“ ausstattet, zeigt er vielversprechende Bedienfähigkeiten, die denen einer menschlichen Haushälterin ähneln – diese Generation von Agenten beginnt zu lernen, Menschen beim täglichen Einkaufen beim „Spielen mit Mobiltelefonen“ zu helfen an Freunde KI kann Benutzern dabei helfen, alles zu erledigen, von der Abgabe von Kommentaren bis zur Reiseplanung.
Leitet das mobile Internet infolgedessen eine neue Revolution in der Intelligenz ein?
Im Zeitalter des mobilen Internets bilden Super-Apps durch die Integration von Diensten einen geschlossenen Verkehrskreislauf, doch das Aufkommen intelligenter Agenten dürfte die Verbindung zwischen Menschen und Diensten neu definieren.
Die Menschen beginnen sich Sorgen darüber zu machen, ob dieser Wandel die neue Landschaft der Technologieunternehmen neu definieren wird: Werden Apps mit der Einführung intelligenter Agenten sterben?
Die Antwort lautet: Apps, die nicht zerstört werden können, werden mithilfe intelligenter Agenten weiterentwickelt.
Heutzutage ist Super App keine Software mehr, sondern ein Einstieg in einen Lebensstil.
Beispielsweise dient die Nutzung von Alipay nicht nur der Bezahlung, sondern auch dem Zugang zu Lebensbereichen wie Finanzmanagement, Reisen, medizinischer Versorgung und Tourismus. Die Nutzung von Meituan erfolgt nicht nur zum Mitnehmen, sondern auch als Treffpunkt für das lokale Leben, beispielsweise in Restaurants , Supermärkte und Filme; mit Douyin sind es nicht nur Kurzvideos, die ein Geschäftsökosystem mit umfangreichen Videoinhalten darstellen.
In der Vergangenheit, im Zeitalter des mobilen Bezahlens, endeten diese Super-Apps damit, „durcheinander zu kommen“, indem sie QR-Codes auslegten, Miniprogramme erstellten und durch Offenheit ein Netzwerk digitaler Dienste aufbauten. Im KI-Zeitalter können sie sich auch mit Tausenden von Offline-Händlern und -Institutionen verbinden und zig Millionen Händlern und Institutionen dabei helfen, von digital auf intelligent umzusteigen.
Nur wenn der intelligente Agent mit echten Benutzerbedürfnissen verknüpft ist, kann er wirklich zum Tragen kommen. Wer das nächste intelligente Agenten-Ökosystem aufbauen kann, das die Benutzeranforderungen vollständig erfüllt, kann zum Einstiegskönig in die KI-Ära werden.
„Dinge, die auf natürliche Sprache reagieren und basierend auf dem Wissen des Benutzers viele verschiedene Aufgaben erledigen können, werden Agenten genannt. Agenten werden nicht nur die Art und Weise verändern, wie jeder mit Computern interagiert, sie werden auch die nächste Plattform sein.“
Bill Gates‘ Definition von Intelligenz ist auch die Zukunft, die wir uns im KI-Zeitalter vorstellen.

Doch in der ersten Jahreshälfte versammelten sich große Hersteller, um auf die 1.0-Stufe der Smart-Agent-Plattform zu wetten, und ihre echte Geldinvestition schaffte es nicht, schnell für großes Aufsehen im Traffic-Pool zu sorgen.
Im Ausland wurde der GPT Store von Open AI bereits im Januar dieses Jahres eingeführt, und Ultraman hatte gehofft, dass er im Inland zum nächsten „App Store“ werden würde. Große Hersteller wie Byte, Baidu und Alibaba haben ebenfalls nacheinander intelligente Plattformen veröffentlicht Ihre Hoffnungen auf die Schaffung von „Super Intelligence“ (Superintelligenz).
Allerdings ähnelte der damalige Agent in der 1.0-Ära, die durch die Entwicklung multimodaler Fähigkeiten begrenzt war, eher einem eloquenten KI-Dialogroboter. Obwohl er den Benutzern Wissen vermitteln konnte, konnte er sich nur auf die Einholung von Vorschlägen beschränken.
Daher haben die meisten Menschen in Bezug auf die Benutzerbindung immer noch eine „Early Adopter“-Haltung gegenüber intelligenten Agenten. Trotz des überwältigenden Datenverkehrs großer Hersteller war das Wachstum von Smart Agents im Hinblick auf die spätere Leistung schwach. Auf der Plattform wurde bisher kein Super Smart Agent geboren.
Letzten Endes handelt es sich um eine große Anzahl gefälschter Anforderungen, die durch KI-Funktionen erzeugt werden und nicht auf die wirklichen Schwachstellen der Benutzer eingehen.
Im Vergleich zur 1.0-Stufe konzentriert sich Agent 2.0 auf bestimmte Szenarien und versucht, die „echten Bedürfnisse“ der Benutzer zu erfüllen.
Bisher konzentrierten sich die B-Seiten-Anwendungen von KI-Agenten hauptsächlich auf das Schreiben von Code und die Erstellung von Hilfsmitteln, während auf der C-Seite intelligente Agenten wie benutzerorientierte Begleitung und psychologische Beratung abgeleitet wurden. Laut QuestMobile-Statistiken sind Texterstellung, Arbeit am Arbeitsplatz und emotionale Begleitung seit Juli dieses Jahres gängige Richtungen für die Implementierung intelligenter Agenten in Mainstream-AIGC-Produkten.
Laut Statistiken aus der AI-Produktliste ist die Zahl der intelligenten Agenten allein in diesem Jahr um 179.000 gestiegen, was 1,5-mal schneller ist als die Wachstumsrate der App Store-Anwendungen.

Quelle: QuestMobile
In der zweiten Hälfte dieses Jahres haben Agenten viele Veränderungen in der Multitasking-Zusammenarbeit erlebt.
„Die heutige große Modellintelligenz entwickelt sich ständig von einfachen Anwendungen zu komplexen Anwendungen weiter, insbesondere bei der Erweiterung von Agenten zu o1-Argumentationsmodellen, sodass sich das System schrittweise weiterentwickelt, um kontinuierlich mit der Außenwelt interagieren zu können“, sagte Zhang Fan, COO von Zhipu.
Essen zum Mitnehmen bestellen und Flugtickets in nur einem Satz buchen ist zur Realität geworden:
Im September startete Alipay seine erste serviceorientierte native App, Zhi Xiaobao. Als KI-Lebensverwalter kann es Benutzern helfen, „Essen, Kleidung, Unterkunft und Transport“ zu erledigen. Sie können alltägliche Aufgaben wie Essen bestellen und U-Bahn-Codes erledigen , und das Herbeirufen eines Taxis mit nur Anweisungen Es kann auch intelligent erkannt werden, basierend auf der von den Benutzern genutzten Zeit und dem Raum, und empfiehlt intelligent Dienste wie Nachrichten-Podcasts, Express-Lieferanfragen und Reisestrategien.

Im Oktober brachte Zhipu das intelligente AutoGLM auf den Markt, das unabhängig voneinander mehrere Apps zur Bedienung auswählen und Benutzern bei der Durchführung von Mobiltelefoninteraktionen helfen kann.
Anschließend folgten auch Mobiltelefonhersteller dem YOYO-Smart-Assistenten von Honor und der Phone Use von vivo, die Benutzern durch Ein-Satz-Anweisungen dabei helfen können, anwendungsübergreifende Vorgänge durchzuführen.
In der Vergangenheit mussten Benutzer umfangreiche Funktionen in komplexen Schnittstellen finden, was für den Benutzer eine Erhöhung der Nutzungskosten bedeutete. Jetzt kann der Agent einfach durch die Äußerung seiner Bedürfnisse per Sprache oder Text direkt auf den Dienst zugreifen und den gewünschten Dienst direkt an den Benutzer weiterleiten.
An diesem Punkt hat der intelligente Agent 2.0, der auf die dringenden Bedürfnisse des täglichen Lebens eingeht, eine bahnbrechende Richtung gefunden – den intelligenten Agenten „Haushälterin“.
Von der Bestellung von Essen zum Mitnehmen über das Hinzufügen von Waren zum Einkaufswagen bis hin zur Stornierung automatischer App-Erneuerungen versuchen Hersteller, intelligente Geräte in unsere täglichen Bedürfnisse zu integrieren, um die Interaktion zwischen Menschen und Diensten weiter zu vereinfachen und Benutzer von der täglichen Interaktion mit Maschinen zu befreien. „Zhi Xiaobao“ hat beispielsweise immer betont, dass „Dinge mit nur einem Wort erledigt werden können“.
Obwohl viele derzeit auf dem Markt befindliche „KI-Butler-Produkte“ eine relativ begrenzte Anzahl von KI-Diensten bereitstellen und komplexere und personalisiertere Aufgaben nicht ausführen können, lässt uns diese evolutionäre Richtung der Mensch-Computer-Interaktion zumindest erkennen, dass wir uns in einer technologischen Entwicklung bewegen Neue Richtung – zusätzlich zum Dialog können wir die KI auch „in meine Augen schauen und handeln“ lassen, um das Leben einfacher zu machen.
Im Zeitalter des mobilen Internets ist Verkehr das Leben. Das Aufkommen intelligenter Agenten wird auch die Regeln der Verkehrsverteilung verändern.
Im Zeitalter 1.0 versuchen Technologieunternehmen aus dem In- und Ausland, superintelligente Agentenplattformen aufzubauen, um den Datenverkehr über intelligente Agenten zu bündeln.
Aber das Denken der 2.0-Ära hat sich geändert. Jetzt versucht jeder, den intelligenten Körper in eine „intelligente Haushälterin“ auf dem Mobiltelefon zu verwandeln und einen neuen Zugang für die Verbindung von Benutzern und Diensten zu schaffen.
Der offensichtlichste Ausdruck dieser Veränderung ist das Layout der Mobiltelefonhersteller. Auf der Consumer Electronics Show 2024 in Berlin sagte Fang Fei, Präsident der Produktlinie Honor: „Wenn der aktuelle intelligente Assistent das manuelle Fahren auf Mobiltelefonen übernimmt, wird der intelligente KI-Agent das automatische Fahren auf Mobiltelefonen ermöglichen.“ die Zukunft.“
Es kann Vorhersagen wie diese geben: Wenn der Smart Agent auf dem Mobiltelefon lernt, erforderliche Funktionen anwendungsübergreifend aufzurufen, z. B. Meituan zum Bestellen von Speisen zum Mitnehmen zu verwenden, Taobao zum Einkaufen von Dingen des täglichen Bedarfs zu öffnen und durch Zerlegen von Aufgabenszenarien verschiedene App-Vorgänge auszuwählen um die Aufgabe abzuschließen. Dementsprechend muss die Super-App nur einige Schnittstellen für den Anruf des intelligenten Agenten bereitstellen. Auf lange Sicht wird die App Teil der Fähigkeiten des intelligenten Agenten, und der Datenverkehr, der zur Super-App hätte fließen sollen, wird ebenfalls dazugehören der intelligente Agent.
Aber im Zeitalter der Diversifizierung der Wirtschaft sind wettbewerbsorientierte und kooperative Beziehungen die Norm. Einerseits müssen Mobiltelefone und Super-Apps ihre KI-Produkte verbessern, die Wettbewerbsfähigkeit der Produkte nutzen, um Benutzer zu gewinnen, und andererseits um die Initiative bei neuen Eingängen konkurrieren, genau wie der Wohlstand des mobilen Internets das Ergebnis ist Jeder fügt Feuerholz hinzu und wird eines Tages erfolgreich sein, die KI-Ära. Das Netzwerk von Diensten wird keineswegs von einem Technologieriesen monopolisiert. Offenheit und Zusammenarbeit sind immer noch die Zukunft der KI.
Wie Zhao Ming, CEO von Honor, sagte, besteht zwischen den beiden eine kollaborative Beziehung. Nachdem der Grenzpunkt gefunden wurde, erledigt jeder seine zugewiesenen Aufgaben durch seine eigene Zusammenarbeit.
Wenn ein intelligenter Agent für Mobiltelefone ein vollständiges Service-Ökosystem eröffnen möchte, ist die integrierte Bereitstellung einer großen Anzahl von Serviceressourcen erforderlich.
Apps können tief in vertikale Szenarien eintauchen, die Entwicklung mit Hilfe intelligenter Agenten abschließen und viele Dienste im KI-Zeitalter erneuern. Gleichzeitig können sie mehr Möglichkeiten erkunden, mit der Verknüpfung von Software und Hardware zu spielen Zusammenarbeit mit Mobiltelefonherstellern.
Während die Hersteller beispielsweise die Entwicklung von KI-Suchprodukten vorantreiben, versuchen Community-Apps wie Xiaohongshu und Zhihu, mithilfe ihrer langfristigen Content-Vorteile vertikale Suchdienste zu schaffen. Nehmen wir als Beispiel Zhihu. Das Unternehmen hat sich auf die akademische Suche konzentriert und mit Zhihu Direct Answer eine professionelle Suchfunktion eingeführt. Damit ist es der erste Hersteller, der eine Komplettlösung für die KI-Suche und die Originalpapierbibliothek anbietet.

Im aktuellen Hype um intelligente Agenten werden ökologische Fähigkeiten auch zum Trumpf und Burggraben von Apps.
Mit 4 Millionen Händler-Miniprogrammen und mehr als 8.000 Life-Service-Funktionen kann Alipays KI-Life-Manager „Zhi Xiaobao“ das Anrufen von Taxis, das Bestellen von Essen, das Buchen von Tickets, U-Bahn-Codes, das Überprüfen von Expresszustellungen, das Bezahlen von Telefonrechnungen und das Überprüfen von Rechnungen unterstützen Verschiedene Lebensdienstleistungen – diese Art der ökologischen Integrationsfähigkeit ist mit einer rein intelligenten Plattform schwer zu erreichen.
Gleichzeitig nutzen die aktuellen KI-Vorgänge, wie etwa das Bestellen von Kaffee, die von Mobiltelefonherstellern demonstriert werden, immer noch technische Lösungen, die auf Bildschirmerkennung und Simulationsvorgängen basieren (Sie werden sehen, wie KI Ihnen dabei hilft, den Bildschirm anzuzeigen und auf Schaltflächen zu klicken), was eine hohe Leistung des erfordert Mobiltelefon, es gibt immer noch Probleme wie langsame Geschwindigkeit und Single-Service.
Wenn Sie möchten, dass die KI bessere Leistungen erbringt, müssen Sie Angebotsänderungen auf der Serviceseite vornehmen – eine große Anzahl von Unternehmensorganisationen kann auch „KI“ nutzen, ihre eigene Intelligenz aufbauen und dann Innovationen bei Lebensdienstleistungen durch offene Schnittstellen fördern. Nur wenn mehr Händler und Institutionen über intelligente Agenten verfügen, kann KI nicht bei einfachen Vorgängen wie der Kaffeebestellung Halt machen, sondern Ihnen dabei helfen, mehr, schneller und genauer zu bestellen und Ihnen sogar dabei zu helfen, den am besten geeigneten Gutschein zu finden.
Zweifellos sind WeChat, Alipay und andere nationale Apps genau so gut, wie im Zeitalter des mobilen Internets Millionen kleiner Programme entwickelt wurden. In Kombination mit dem einzigartigen Plattform-Ökosystem kann App auch zu einer neuen intelligenten Agentenplattform werden und mithilfe differenzierter Dienste aus dem KI-Nahkampf ausbrechen.
Nachdem Tencent beispielsweise die intelligente Assistenten-App „Yuanbao“ eingeführt hatte, startete Alipay auch die intelligente Entwicklungsplattform „Treasure Box“, die es Händlern ermöglicht, Benutzern aktuellere Dienste anzubieten.
Nehmen wir als Beispiel „Huang Xiaosong“. Dabei handelt es sich um einen intelligenten Agenten, der von der Huangshan Scenic Area auf der Zhixiaobao-Plattform eingerichtet wurde. Er kann Touristen, die Huangshan besuchen, in Echtzeit Reiseführer für Touristenattraktionen, Empfehlungen für landschaftlich reizvolle Hotels, Powerbank-Anfragen und andere Dienstleistungen anbieten.
Darüber hinaus können App-Hersteller auch von Mobiltelefonen aussteigen und sich mit intelligenterer Hardware wie AR-Brillen, intelligenten Lautsprechern, intelligenten Autos usw. verbinden . Künftig wird KI allgegenwärtig sein, Dienste werden auf Anfrage verfügbar sein und die Methoden der Mensch-Computer-Interaktion werden vielfältiger und innovativer sein.
Zuvor hatte Doubao, eine Tochtergesellschaft von ByteDance, das Olla Friend auf den Markt gebracht, ein KI-Smart-Headset, das Benutzern einen „KI-Freund“ bietet, der Funktionen wie tragbares Besserwissertum, Englischtraining, Reiseführer und emotionale Tankstelle vereint; Sie wird nächste Woche auf den Markt kommen. Die neue Rokid AR-Brille wird auch mit Zhi Xiaobao zusammenarbeiten, um Funktionen wie KI-Taxiruf, KI-Essensbestellung und Sprachabdruck-Schnellzahlung einzuführen und so weitere Lebensszenen abzudecken.
Im KI-Zeitalter wird der Umbildungszyklus noch weiter verkürzt. Zhu Xiaohu sagte einmal unverblümt: „Wenn alle nach 6 Monaten in den Hotspot stürmen und Sie nicht an der Spitze sind, hat der Hotspot im Grunde nichts mit Ihnen zu tun. Wenn der kurzfristige Hotspot kommt, niemand.“ will zuerst den Pokertisch verlassen, KI Die nächste Generation neuer Mobiltelefone wird geboren, und Apps hoffen auch, KI zu nutzen, um sich wieder weiterzuentwickeln. Die Pioniere, die als Erste eingesetzt werden, werden zweifellos die nächste Ära gewinnen.
Aber was noch wichtiger ist: Wer alleine reist, ist schnell, und wer zusammen reist, ist weit weg. Im KI-Zeitalter ist kein Unternehmen dominant, aber es gibt noch mehr Zusammenarbeit. Offenheit und Verbindung sind ursprünglich die ursprüngliche Bedeutung des Internets. Erst wenn Software und Hardware zueinander offen sind und unzählige intelligente Agenten miteinander verbunden sind, können echte Veränderungen herbeigeführt werden.