livewhisper.py出力Psuedo-live文による文章によるターミナルへの出力。 OpenaiのささやきモデルとSoundDeviceライブラリを使用して、マイクを聴きます。マイクからのオーディオは、ボリュームと周波数のしきい値に到達した場合に保存され、沈黙が検出されると、オーディオを一時ファイルに保存して、ウィスパーに送信します。
依存関係:ささやき、numpy、scipy、sounddevice
LiveWhisperは、音声認識に代わるものとして多少機能できます。それは今ではそれが独自のささやきのサポートを持っているので、それはあなた次第です。 ;)
また、ライブassistant.pyをベースとして使用して、Siri、Alexa、Jarvisなどのシンプルな音声コマンドアシスタントを作る私の試みです。
Same dependencies as livewhisper, as well as requests, pyttsx3, wikipedia, bs4. Also needs: espeak and python3-espeak.
ボイスアシスタントは、名前、デフォルトの「コンピューター」、「Hey Computer」、または「OK Computer」も機能していると言ってアクティブにすることができます。コンピューターが応答するのを待つか、すぐに一時停止せずにアクション/質問をリクエストすることができます。
利用可能な機能:天気、日付と時刻、ジョーク、ウィキペディアの検索を行います。また、基本的な数学や本物の単純なトリビアなど、他のリクエストも処理できます。 Googleのインスタント回答のスニペットに依存しており、時には機能しないことがあります。
使用:プレイ、一時停止、次へ、前、停止、何がプレイしているのかを使用して、メディアプレイヤーを制御しますか?メディアコントロールには、何らかの形のノイズ/エコーキャンセルが正しく機能する必要があります。 Linux Pulseaudioでそれを有効にする方法の詳細については、このページを参照してください。
ctrl+cを介してアシスタントを閉じるか、それが名前と「終了」だと言って閉じることができます。
あなたが私のプロジェクトが好きで、私がもっと作り続けるのを手伝いたいなら、私のKO-Fiページに寄付することを検討してください!ありがとう!