이것은 YouTube에서 음악 재생, 오류 수정, 일반 챗봇처럼 채팅하는 등 다양한 작업을 수행 할 수있는 개인 음성 어시스턴트입니다. 어시스턴트는 Python을 사용하여 제작되었으며 여러 라이브러리와 API를 활용하여 기능을 제공합니다.
비디오를 봅니다
오류 수정 프로세스 :
사용자가 오류를보고하면 Personal Voice Assistant는 현재 화면의 스크린 샷을 사용하여 정확한 문제를 캡처합니다. 그런 다음이 이미지는 OpenCV를 사용하여 스크린 샷에서 텍스트를 추출하여 처리됩니다. 추출 된 텍스트는 LLAMA 3 언어 모델로 전송되며 내용을 분석하고 관련 응답 또는 솔루션을 생성합니다. 그런 다음 어시스턴트는 제안 된 수정 또는 문제 해결 단계를 사용자에게 전달하여 간소화되고 효과적인 해상도 프로세스를 보장합니다.
시스템에 Python이 설치되어 있는지 확인하십시오. python.org에서 다운로드 할 수 있습니다.
저장소 복제 :
git clone https://github.com/kiritoInd/Personal-Voice-Assistant.git
cd Personal-Voice-Assistant필요한 패키지 설치 :
pip install -r requirements.txt 프로젝트의 루트 디렉토리에서 .env 파일을 만들고 Groq API 키를 추가하십시오.
GROQ_API_KEY = your_groq_api_key python main.py
기능 호출 목록을 통해 조수에 더 많은 기능을 추가 할 수 있습니다. DataCamp의 OpenAI 기능 호출 자습서에서 기능 호출에 대해 자세히 알아보십시오.
메타 llama3에도 동일하게 사용할 수 있습니다
기능 호출 목록을 통해 조수에 더 많은 기능을 추가 할 수 있습니다. DataCamp의 OpenAI 기능 호출 자습서에서 기능 호출에 대해 자세히 알아보십시오.
새로운 기능을 추가하려면 코드에서 function_calling_template 업데이트하십시오.
function_calling_template = """
<tools> {
"name": "Your Function",
"description": "Description of the function",
"parameters": {
"type": "object",
"properties": {},
"required": [],
},
} </tools>
""" jsonspeech_recognitionpyttsx3groqPillowopencv-python-headlesspytesseractdatasetstorchtransformerssoundfilesounddevicerequestsbeautifulsoup4keyboardtkinter 이 프로젝트는 MIT 라이센스에 따라 라이센스가 부여됩니다. 자세한 내용은 라이센스 파일을 참조하십시오.