Sabes el sueño
Hable con la computadora, y le dice, o hace algo útil.
Probablemente sepas el problema
Actualmente, los agentes de IA y los bots de chat son lentos y caros. Cometen errores tontos. Son olvidadizos. Y trabajan demasiado reinventando la rueda.
Lo que la mayoría de la gente probablemente no se da cuenta
Incluso el más simple de VOX in & Vox Out UX, especialmente cuando se combina con comportamientos de agente, es difícil . Es asíncrono y generalmente frustrantemente lento. Es una nueva forma de interactuar con las computadoras, lo que requiere un repensación global de cuán diferentes interactúan las modalidades de control y visualización de control y visualización.
Profundamente TIENE Está trabajando en A Soluciones
Estoy trabajando para ayudar a los agentes a recordar qué problemas ya han resuelto, o si han resuelto algo semánticamente sinónimo o computacionalmente análogo antes.
El resultado
Respuestas rápidas y en tiempo real, devoluciones de llamada asincrónicas para grandes trabajos e interacción más natural, como humana. ¡Querrás hablar con tu computadora!
La vista desde 30,000 pies
Hay dos formas de responder una pregunta cuando se usa VOX 2 VOX 2 VOX: la forma rápida o agonizante lenta. Las líneas y cajas punteadas verdes son la forma más rápida a través de este diagrama de flujo (profundamente. Agentes de AI), las líneas y las cajas de puntos rojos tardan entre 100 y 200 veces más en ejecutarse (chatgpt & langchain).
Enfoque actual
Actualmente estoy trabajando en
- Aprendizaje de agente (refactorización de código) basado en problemas previamente resueltos almacenados en la memoria a largo plazo
- Uso de la asignación de consulta a función similar a lo que está haciendo ChatGPT, y
- Proporcionar retroalimentación humana en el bucle cuando los agentes salen mal
La realidad actual
- Puedo realizar tareas de navegación básica con Firefox usando mi voz
- Puedo editar, regrabar y revisar documentos usando mi voz
- También puedo interactuar con Pycharm usando mi voz
El plan (cercano) futuro: EOY 2023
- Interactuar sin problemas, asincrónicamente y en tiempo real, con aplicaciones calendarias y de la lista de tareas con mi voz
- Haga lo mismo con un asistente de investigación web para reemplazar lo que estoy haciendo manualmente con chatgpt
- Haz que mis agentes me hable con cualquiera de mis voces de personajes favoritos en varios idiomas
- Host de mi propio servidor LLM interno para la privacidad y la seguridad
El (lejano) sueño futuro: 2024
- Interactuar con mis agentes, servidores y computadoras usando mi voz, y haga que haga lo que quiero que haga, cuándo y cómo quiero que se haga. No estoy pidiendo mucho, ¿verdad?
- De manera segura y segura, por supuesto
- Paz mundial, no x, y todo eso también
DESCARGO DE RESPONSABILIDAD
Este proyecto Genie-in-the-Box es actualmente un conjunto extremadamente grande de bocetos de trabajo que estoy organizando y ordenando activamente para poder colaborar con otros.
Entonces, todavía no estoy allí, obviamente . Pero estoy trabajando en ello y me acerco todos los días.
¿Interesado?
¡Comenzar!