Este es un asistente de voz personal que puede realizar varias tareas, como reproducir música desde YouTube, arreglar errores y charlar contigo como un chatbot normal. El asistente se construye con Python y aprovecha varias bibliotecas y API para proporcionar sus funcionalidades.
Mira el video
Proceso de corrección de errores:
Cuando un usuario informa un error, el Asistente de voz personal toma una captura de pantalla de la pantalla actual para capturar el problema exacto. Esta imagen se procesa utilizando OpenCV para extraer el texto de la captura de pantalla. El texto extraído se envía al modelo de lenguaje LLAMA 3, que analiza el contenido y genera una respuesta o solución relevante. Luego, el asistente comunica la solución sugerida o la solución de problemas de regreso al usuario, asegurando un proceso de resolución simplificado y efectivo.
Asegúrese de tener Python instalado en su sistema. Puede descargarlo de python.org.
Clon el repositorio:
git clone https://github.com/kiritoInd/Personal-Voice-Assistant.git
cd Personal-Voice-AssistantInstale los paquetes requeridos:
pip install -r requirements.txt Cree un archivo .env en el directorio raíz del proyecto y agregue su clave de API Groq:
GROQ_API_KEY = your_groq_api_key python main.py
Puede agregar más funcionalidades al asistente a través de la lista de llamadas de funciones. Obtenga más información sobre las llamadas de funciones en el tutorial de llamadas de funciones OpenAI de DataCamp.
Puedes usar lo mismo para meta llama3
Puede agregar más funcionalidades al asistente a través de la lista de llamadas de funciones. Obtenga más información sobre las llamadas de funciones en el tutorial de llamadas de funciones OpenAI de DataCamp.
Para agregar nuevas funciones, actualice la function_calling_template en el código:
function_calling_template = """
<tools> {
"name": "Your Function",
"description": "Description of the function",
"parameters": {
"type": "object",
"properties": {},
"required": [],
},
} </tools>
""" jsonspeech_recognitionpyttsx3groqPillowopencv-python-headlesspytesseractdatasetstorchtransformerssoundfilesounddevicerequestsbeautifulsoup4keyboardtkinter Este proyecto tiene licencia bajo la licencia MIT; consulte el archivo de licencia para obtener más detalles.