Sie kennen den Traum
Sprechen Sie mit dem Computer, und es sagt Ihnen etwas Nützliches.
Sie kennen wahrscheinlich das Problem
Derzeit sind AI -Agenten und Chat -Bots langsam und teuer. Sie machen alberne Fehler. Sie sind vergesslich. Und sie arbeiten zu hart, um das Rad neu zu erfinden.
Was die meisten Menschen wahrscheinlich nicht erkennen
Selbst die einfachste Vox in & vox -out ux - insbesondere in Verbindung mit agentenverhalten - ist schwierig . Es ist asynchron und normalerweise frustrierend langsam. Es ist eine neue Art der Interaktion mit Computern, die eine globale Überlegung dessen erfordert, wie unterschiedlich die UI-Steuerung und -modalitäten angezeigt werden.
Tief HAT Arbeitet an A Lösungen
Ich arbeite daran, Agenten zu helfen, sich daran zu erinnern, welche Probleme sie bereits gelöst haben oder ob sie zuvor etwas semantisch Synonym oder rechenintensiv gelöst haben.
DAS ERGEBNIS
Schnelle Reaktionen in Echtzeit, asynchrone Rückrufe für große Jobs und natürlichere, menschlichere Interaktion. Sie werden mit Ihrem Computer sprechen wollen!
Die Aussicht von 30.000 Fuß
Es gibt zwei Möglichkeiten, eine Frage bei der Verwendung von Agentic Vox 2 Vox zu beantworten: den schnellen oder qualvoll langsamen Weg. Die grünen gepunkteten Linien und Kisten sind der schnellste Weg durch dieses Flow -Diagramm (tiefgreifende Agenten), die roten gepunkteten Linien und Boxen dauern zwischen 100 und 200 Mal länger (Chatgpt & Langchain).
Aktueller Fokus
Ich arbeite gerade daran
- Agentenlernen (Code Refactoring) basierend auf zuvor gelösten Problemen, die im Langzeitgedächtnis gespeichert sind
- Verwenden von Abfragen zu Funktionskarte, ähnlich wie Chatgpt
- Das Feedback des Menschen im Loop -Feedback, wenn Agenten schief gehen
Die gegenwärtige Realität
- Ich kann grundlegende Browseraufgaben mit Firefox mit meiner Stimme ausführen
- Ich kann Dokumente mit meiner Stimme bearbeiten, berechnen und Korrekturlesen
- Ich kann auch mit meiner Stimme mit Pycharm interagieren
Der (nahe) zukünftige Plan: Eoy 2023
- Wenden Sie sich nahtlos, asynchron und in Echtzeit mit Kalender- und Todo -Listen -Apps mit meiner Stimme
- Tun Sie dasselbe mit einem Web -Research -Assistenten, um das zu ersetzen, was ich manuell durch Chatgpt mache
- Lassen Sie meine Agenten mit einer meiner Lieblingsfiguren in mehreren Sprachen mit mir sprechen
- Hosten Sie meinen eigenen internen LLM -Server für Privatsphäre und Sicherheit
Der (weit) zukünftige Traum: 2024
- Interagieren Sie mit meinen Agenten, Servern und Computern mit meiner Stimme und lassen Sie es tun, was ich möchte, wenn & wie ich es möchte. Ich frage nicht viel, oder?
- Natürlich sicher und sicher, natürlich
- Weltfrieden, non x und all das auch
HAFTUNGSAUSSCHLUSS
Dieses Genie-in-the-Box-Projekt ist derzeit eine extrem große Reihe von Arbeitskizzen, die ich aktiv organisiere und aufräumen, damit ich mit anderen zusammenarbeiten kann.
Also bin ich natürlich noch nicht da. Aber ich arbeite daran und komme jeden Tag näher.
Interessiert?
Beginnen!