Você conhece o sonho
Converse com o computador, e ele diz, ou faz algo útil.
Você provavelmente conhece o problema
Atualmente, os agentes da IA e os bots de bate -papo são lentos e caros. Eles cometem erros tolos. Eles são esquecidos. E eles trabalham muito reinventando a roda.
O que a maioria das pessoas provavelmente não percebe
Mesmo o mais simples do Vox in & vox Out UX - especialmente quando associado a comportamentos agênticos - é difícil . É assíncrono e geralmente frustrantemente lento. É uma nova maneira de interagir com os computadores, que requer uma repensação global de quão diferentes as modalidades de controle e exibição interagem.
Profundamente TEM Está trabalhando em UM Soluções
Estou trabalhando para ajudar os agentes a se lembrar de quais problemas eles já resolveram ou se resolveram algo semanticamente sinônimos ou computacionalmente análogos antes.
O resultado
Respostas rápidas, em tempo real, retornos de chamada assíncronos para grandes empregos e interação mais natural e humana. Você vai querer falar com seu computador!
A vista de 30.000 pés
Existem duas maneiras de responder a uma pergunta ao usar o Vox 2 Vox: o jeito rápido ou agonizantemente lento. As linhas e caixas pontilhadas verdes são a maneira mais rápida através desse fluxograma (agentes profundamente.ai), as linhas pontilhadas e caixas vermelhas levam de 100 a 200 vezes mais para executar (Chatgpt & Langchain).
Foco atual
Estou atualmente trabalhando em
- Aprendizagem agêntica (refatoração de código) com base em problemas resolvidos anteriormente armazenados na memória de longo prazo
- Usando o mapeamento de consulta a função semelhante ao que o chatgpt está fazendo e
- Fornecendo humano no feedback do loop quando os agentes dão errado
A realidade atual
- Eu posso executar tarefas básicas de navegação com o Firefox usando minha voz
- Eu posso editar, verificar e revisar documentos usando minha voz
- Eu também posso interagir com PyCharm usando minha voz
O (próximo) plano futuro: EOY 2023
- Interagir perfeitamente, de forma assíncrona e em tempo real, com aplicativos de listar de calendário e TODO usando minha voz
- Faça o mesmo com um assistente de pesquisa na web para substituir o que estou fazendo manualmente pelo chatgpt
- Peça aos meus agentes que falem comigo com qualquer uma das minhas vozes de personagens favoritas em vários idiomas
- Hospedar meu próprio servidor LLM interno para privacidade e segurança
O (distante) o futuro sonho: 2024
- Interaja com meus agentes, servidores e computadores usando minha voz e faça com que faça o que eu quero, quando e como eu quero. Não estou pedindo muito, estou?
- Com segurança e segurança, é claro
- Paz mundial, non x, e tudo isso também
ISENÇÃO DE RESPONSABILIDADE
Atualmente, este projeto Genie-in-the-Box é um conjunto extremamente grande de esboços de trabalho que estou organizando e arrumando ativamente para que eu possa colaborar com outras pessoas.
Então, ainda não estou lá, obviamente . Mas estou trabalhando nisso e me aproximando todos os dias.
Interessado?
Começar!