voice IT Descargar - Descargar código fuente de voice IT

voice IT

Otro código fuente

1.0.0

Descargar

Voz

Jugando con el habla a texto y el texto de Android; Configurar una palabra de atención que no sea OK Google e intentar coincidir con el texto convertido con una ontología dada

Por qué, oh por qué

Bueno, uno de nuestros clientes quería que un asistente virtual sea de manos libres para manejar pedidos como 'Enviarme un montón de Product-X la próxima semana', 'Enviar lo mismo que la semana pasada' o '¿Dónde mis cosas?' Algo así como Amazon's Echo o Google Home

Nuestra idea era crear un objeto impreso en 3D que ocultara una Raspberry Pi dentro que manejaría las interacciones de voz y eventualmente realizaría llamadas de descanso a los servicios de CRM o lo que sea y luego volver a traducir el texto al habla.

Como primer prototipo, configuramos una aplicación de Android que haría todo esto, dado que la API de Android proporciona ambos discursos para enviar un mensaje de texto al habla, hay un altavoz y un micrófono ya integrado y no tendríamos que lidiar con cosas de hardware desde el principio.

¡¿¿¡CÓMO!??!

Por lo tanto, hemos creado una aplicación Android que tiene 2 pasos/acciones/pantallas: primero un receptor infinito de palabras de atención (a la "Ok Google") y segundo, un receptor de comando que coincide con el texto reconocido con un conjunto de acciones dadas.

Para nuestro pequeño prototipo, nos preparamos para enviar comandos a un pequeño dron en forma de "¡Hey Robot -> Do un salto de longitud!/¡Avance un poco/gire a la derecha y gire!"

Las acciones se definieron a través de un archivo de ontología, creado a través del proyecto de ontología de Stanford 'protegido'

Una vez que el texto se reconoce a través de la API del habla de Android, (muy básicamente) buscamos acciones en la ontología que a su vez responde con un método API. ¡El método API se ejecuta y nuestra implementación actual hace que nuestro dron se mueva!

Campo de golf

Refactoramos mucho código para que coincida con lo que la gente había hecho en Gast-Lib
API de discurso a texto
API de texto a discurso
API de drones
Parser de archivo de ontología para Android

Un diagrama de arquitectura básica

¡Archi!

¿Qué sigue?

Bueno, hay un montón de cosas que nos gustaría hacer:

En Android, evite el cuadro de diálogo Reconocidor de voz con el botón. Lo probé, ¡pero es buggy!
Mejorar el tiempo entre ' Palabra de despertar reconocida ' y ' Comandos listos para recibir '
Reconocer el discurso natural y no solo las opciones de palabras:
- Stanford NLP?
- [Rasa NLU] (https://rasa.ai/)
Analice una lista de acciones en lugar de solo comandos de uno a tiempo (¡combo!)
Analizar texto y reconocer acciones y parámetros a través de NLP (procesamiento del lenguaje natural)
¡Haga que todo funcione en un RaspberryPi!
- Habla a texto (fuera de línea idealmente)
- Texto a voz
Use Apache Jena para analizar y buscar a través de la ontología

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-05-21
tamaño 23.97MB
Proviene de Github

Aplicaciones relacionadas

GLM 4 Voice

2024-11-02
Retrieval based Voice Conversion WebUI

2024-11-01
súper encuéntralo

2023-10-13
Llegar a casa

2022-08-04
Interfaz SMS ilimitada de GOOGLE VOICE

2009-11-07
¡Compáralo!

2009-06-22

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo