Personal Voice Assistant Using LLM FunctionCalling - Personal Voice Assistant Using LLM FunctionCalling

Personal Voice Assistant Using LLM FunctionCalling

Código Fuente de IA

1.0.0

Descargar

Asistente de voz personal

Este es un asistente de voz personal que puede realizar varias tareas, como reproducir música desde YouTube, arreglar errores y charlar contigo como un chatbot normal. El asistente se construye con Python y aprovecha varias bibliotecas y API para proporcionar sus funcionalidades.

Avance

Mira el video

Características

Reproduce música de YouTube : puedes pedirle al asistente que reproduzca música de YouTube basada en una consulta de búsqueda.
Arreglar los errores : el asistente puede tomar una captura de pantalla, extraer texto de la imagen e intentar corregir cualquier error encontrado en el texto.
Chatbot : El asistente puede participar en conversaciones normales con usted.

Proceso de corrección de errores:

Cuando un usuario informa un error, el Asistente de voz personal toma una captura de pantalla de la pantalla actual para capturar el problema exacto. Esta imagen se procesa utilizando OpenCV para extraer el texto de la captura de pantalla. El texto extraído se envía al modelo de lenguaje LLAMA 3, que analiza el contenido y genera una respuesta o solución relevante. Luego, el asistente comunica la solución sugerida o la solución de problemas de regreso al usuario, asegurando un proceso de resolución simplificado y efectivo.

Empezando

Requisitos previos

Asegúrese de tener Python instalado en su sistema. Puede descargarlo de python.org.

Instalación

Clon el repositorio:

git clone https://github.com/kiritoInd/Personal-Voice-Assistant.git
cd Personal-Voice-Assistant

Instale los paquetes requeridos:
```
pip install -r requirements.txt
```

Variables de entorno

Cree un archivo .env en el directorio raíz del proyecto y agregue su clave de API Groq:

 GROQ_API_KEY = your_groq_api_key

Dirigiendo al asistente

Ejecute el siguiente comando para iniciar el asistente de voz:

python main.py

Uso

Inicie el asistente : haga clic en el botón "Bot de inicio" en la GUI para iniciar el asistente.
Palabra de activación : Diga "hola" para activar el asistente.
Comandos :
- Reproduce música : "Reproducir [nombre de la canción] de YouTube".
- Se corrigió el error : "¿Puedes corregir este error?"
- Chat : participar en una conversación normal.

Agregar más funciones

Puede agregar más funcionalidades al asistente a través de la lista de llamadas de funciones. Obtenga más información sobre las llamadas de funciones en el tutorial de llamadas de funciones OpenAI de DataCamp.

Puedes usar lo mismo para meta llama3

Agregar más funciones

Puede agregar más funcionalidades al asistente a través de la lista de llamadas de funciones. Obtenga más información sobre las llamadas de funciones en el tutorial de llamadas de funciones OpenAI de DataCamp.

Para agregar nuevas funciones, actualice la function_calling_template en el código:

 function_calling_template = """ 
    <tools> {
    "name": "Your Function",
    "description": "Description of the function",
    "parameters": {
        "type": "object",
        "properties": {},
        "required": [],
    },
    } </tools>
  """