これは、YouTubeから音楽を再生したり、エラーを修正したり、通常のチャットボットのようにあなたとチャットするなど、さまざまなタスクを実行できる個人的な音声アシスタントです。アシスタントはPythonを使用して構築され、いくつかのライブラリとAPIをレバレッジして機能を提供します。
ビデオをご覧ください
エラー修正プロセス:
ユーザーがエラーを報告すると、Personal Voice Assistantが現在の画面のスクリーンショットを取り、正確な問題をキャプチャします。この画像は、OpenCVを使用して処理され、スクリーンショットからテキストを抽出します。抽出されたテキストはLlama 3言語モデルに送信され、コンテンツを分析し、関連する応答またはソリューションを生成します。その後、アシスタントは、推奨される修正またはトラブルシューティングのステップをユーザーに戻し、合理化された効果的な解決プロセスを確保します。
システムにPythonがインストールされていることを確認してください。 python.orgからダウンロードできます。
リポジトリをクローンします:
git clone https://github.com/kiritoInd/Personal-Voice-Assistant.git
cd Personal-Voice-Assistant必要なパッケージをインストールします。
pip install -r requirements.txtプロジェクトのルートディレクトリに.envファイルを作成し、GROQ APIキーを追加します。
GROQ_API_KEY = your_groq_api_key python main.py
関数呼び出しリストを介して、より多くの機能をアシスタントに追加できます。 DataCampのOpenAI Calling Tutorialで関数呼び出しの詳細をご覧ください。
Meta Llama3に同じものを使用できます
関数呼び出しリストを介して、より多くの機能をアシスタントに追加できます。 DataCampのOpenAI Calling Tutorialで関数呼び出しの詳細をご覧ください。
新しい関数を追加するには、コードのfunction_calling_templateを更新します。
function_calling_template = """
<tools> {
"name": "Your Function",
"description": "Description of the function",
"parameters": {
"type": "object",
"properties": {},
"required": [],
},
} </tools>
""" jsonspeech_recognitionpyttsx3groqPillowopencv-python-headlesspytesseractdatasetstorchtransformerssoundfilesounddevicerequestsbeautifulsoup4keyboardtkinter このプロジェクトは、MITライセンスに基づいてライセンスされています。詳細については、ライセンスファイルを参照してください。