Tu connais le rêve
Parlez à l'ordinateur, et il vous dit ou fait quelque chose d'utile.
Vous connaissez probablement le problème
Actuellement, les agents de l'IA et les robots de chat sont lents et coûteux. Ils font des erreurs idiotes. Ils sont oublieux. Et ils travaillent trop dur pour réinventer la roue.
Ce que la plupart des gens ne réalisent probablement pas
Même le plus simple de Vox dans & Vox Out UX - en particulier lorsqu'il est associé à des comportements agentiques - est difficile . C'est asynchrone et généralement frustrant. C'est une nouvelle façon d'interagir avec les ordinateurs, ce qui nécessite une refonte globale de la différence des modalités de contrôle et d'affichage de l'interface utilisateur.
Profondément A Travaille sur UN Solutions
Je travaille à aider les agents à se rappeler les problèmes qu'ils ont déjà résolus, ou s'ils ont résolu quelque chose de sémantiquement synonyme ou de calcul en informatique auparavant.
Le résultat
Réponses rapides et en temps réel, rappels asynchrones pour les gros travaux et une interaction plus naturelle et humaine. Vous voudrez parler à votre ordinateur!
La vue de 30 000 pieds
Il existe deux façons de répondre à une question lors de l'utilisation de Vox 2 Vox 2: la manière rapide ou angoissante. Les lignes et les boîtes en pointillés verts sont le moyen le plus rapide à travers ce graphique de flux (agents profondément.
Focus actuel
Je travaille actuellement sur
- Apprentissage agentique (refactoring de code) basé sur des problèmes précédemment résolus stockés dans la mémoire à long terme
- Utilisation de la mappage de la requête à fonction similaire à ce que fait Chatgpt, et
- Fournir des commentaires humains dans la boucle lorsque les agents vont mal
La réalité actuelle
- Je peux effectuer des tâches de navigation de base avec Firefox en utilisant ma voix
- Je peux éditer, vérifier orthographié et relire des documents en utilisant ma voix
- Je peux également interagir avec PyCharm en utilisant ma voix
Le (proche) plan futur: EOY 2023
- Interagir de manière transparente, de manière asynchrone et en temps réel, avec des applications de calendrier et de liste de tâches en utilisant ma voix
- Faites de même avec un assistant de recherche sur le Web pour remplacer ce que je fais manuellement par Chatgpt
- Demandez à mes agents de me parler avec l'une de mes voix de personnage préférées en plusieurs langues
- Hébergez mon propre serveur LLM interne pour la confidentialité et la sécurité
The (Far) Future Dream: 2024
- Interagissez avec mes agents, serveurs et ordinateurs à l'aide de ma voix et faites-le faire ce que je veux qu'il fasse, quand et comment je le veux. Je ne demande pas grand-chose, n'est-ce pas?
- En toute sécurité et en toute sécurité, bien sûr
- Paix mondiale, non x, et tout ça aussi
CLAUSE DE NON-RESPONSABILITÉ
Ce projet Genie-in-the-Box est actuellement un ensemble extrêmement important de croquis de travail que j'organise et range activement afin que je puisse collaborer avec d'autres.
Donc, je ne suis pas encore là, évidemment . Mais je travaille dessus et je me rapproche chaque jour.
Intéressé?
Commencer!