Это личный голосовой помощник, который может выполнять различные задачи, такие как воспроизведение музыки с YouTube, исправление ошибок и общение с вами, как обычный чат -бот. Помощник строится с использованием Python и использует несколько библиотек и API, чтобы обеспечить свои функции.
Посмотрите видео
Процесс исправления ошибок:
Когда пользователь сообщает об ошибке, личный голосовой помощник делает снимок экрана текущего экрана, чтобы запечатлеть точную проблему. Затем это изображение обрабатывается с использованием OpenCV для извлечения текста из скриншота. Извлеченный текст отправляется в языковую модель Llama 3, которая анализирует содержание и генерирует соответствующий ответ или решение. Затем помощник передает предложенные исправления или устранение неполадок, направленных на устранение неполадок обратно пользователю, обеспечивая оптимизированный и эффективный процесс разрешения.
Убедитесь, что у вас установлен Python в вашей системе. Вы можете скачать его с python.org.
Клонировать репозиторий:
git clone https://github.com/kiritoInd/Personal-Voice-Assistant.git
cd Personal-Voice-AssistantУстановите необходимые пакеты:
pip install -r requirements.txt Создайте файл .env в корневом каталоге проекта и добавьте свой клавиша API Groq:
GROQ_API_KEY = your_groq_api_key python main.py
Вы можете добавить больше функциональных возможностей помощнику через список вызова функции. Узнайте больше о вызове функций в DataCamp's Function Function Tutorial.
Вы можете использовать то же самое для Meta llama3
Вы можете добавить больше функциональных возможностей помощнику через список вызова функции. Узнайте больше о вызове функций в DataCamp's Function Function Tutorial.
Чтобы добавить новые функции, обновите function_calling_template в коде:
function_calling_template = """
<tools> {
"name": "Your Function",
"description": "Description of the function",
"parameters": {
"type": "object",
"properties": {},
"required": [],
},
} </tools>
""" jsonspeech_recognitionpyttsx3groqPillowopencv-python-headlesspytesseractdatasetstorchtransformerssoundfilesounddevicerequestsbeautifulsoup4keyboardtkinter Этот проект лицензирован по лицензии MIT - для получения подробной информации см. Файл лицензии.