Bailingは、音声を通じてユーザーと自然な会話をするように設計されたオープンソースの音声会話アシスタントです。このプロジェクトは、音声認識(ASR)、音声アクティビティ検出(VAD)、大手言語モデル(LLM)、音声合成(TTS)テクノロジーを組み合わせています。これは、ASR+LLM+TTSを介して実装されたGPT-4oのような音声会話ロボットで、800msのエンドツーエンドの遅延で高品質の音声会話エクスペリエンスを提供します。 Bailingは、GPUを必要とせずにGPT-4Oのような対話効果を達成することを目指しており、さまざまなエッジデバイスや低リソース環境に適しています。

救済は、次の技術コンポーネントを通じて音声対話機能を実現します。

Robotは、効率的なタスク管理とメモリ管理を担当し、ユーザー割り込み要求をインテリジェントに処理できますが、さまざまなモジュール間のシームレスな調整と接続を実現して、スムーズなインタラクティブエクスペリエンスを確保できます。
| プレイヤーステータス | 話すかどうか | 説明します |
|---|---|---|
| 演奏 | 話していない | 普通 |
| 演奏 | 言う | シーンを中断します |
| プレイされていません | 話していない | 普通 |
| プレイされていません | 言う | VAD判決、ASR認識 |
救済オーディオダイアログ
救済オーディオダイアログ
開発環境に次のツールとライブラリがインストールされていることを確認してください。
pipパッケージマネージャープロジェクト倉庫のクローニング:
git clone https://github.com/wwbin2017/bailing.git
cd bailingインストールに必要な依存関係:
pip install -r requirements.txt環境変数を構成します:
プロジェクトを実行する:
cd server
python server.py # 启动后端服务,也可不执行这一步python main.py将来、救済は、比類のないメモリや将来を見据えたタスク管理機能を備えた思いやりのあるシンクタンクのように、ジャービスのようなパーソナルアシスタントに昇華します。最先端のぼろきれとエージェントテクノロジーに依存すると、問題と知識を正確に制御し、複合施設を簡素化します。 「最近のニュースを見つけるのを手伝ってください」や「大きなモデルの最新の開発を要約する」などのささやき声は、bailingが迅速に対応し、スマートに分析し、リアルタイムで追跡し、結果を優雅に提示します。あなたはアシスタントだけでなく、あなたのニーズに精通している賢いパートナーがいると想像してください。
| 関数名 | 説明する | 関数 | 例 |
|---|---|---|---|
get_weather | 場所の天気情報を入手してください | ロケーション名を提供した後、場所の気象条件に戻ります | ユーザーは言った:「杭州の天気はどうですか?」 → zhejiang/hangzhou |
ielts_speaking_practice | IELTSオーラルプラクティス | IELTSオーラルエクササイズの質問と対話を生成して、ユーザーがIELTSオーラルエクササイズを実践できるようにする | - |
get_day_of_week | 今週または日付を取得します | ユーザーが現在の時間、日付、または曜日を要求すると、対応する情報が返されます | ユーザーは言った:「今日は何日ですか?」 →今週に戻ります |
schedule_task | 時限タスクを作成します | ユーザーはタスクの実行時間とコンテンツを指定し、ユーザーに定期的に思い出させることができます | ユーザーは次のように述べています。「毎朝8時に水を飲むことを思い出させてください。」 → time: '08:00', content: '提醒我喝水' |
open_application | Macで指定されたアプリケーションを開きます | ユーザーはアプリケーションの名前を指定でき、スクリプトはMacで対応するアプリケーションを起動します | ユーザーは「Safariを開く」と言った。 → application_name: 'Safari' |
web_search | 指定されたキーワードをオンラインで検索します | ユーザーが提供する検索コンテンツに基づいて、対応する検索結果を返します | ユーザーは次のように述べています。「最新の技術ニュースを検索します。」 → query: '最新的科技新闻' |
貢献は大歓迎です!保釈プロジェクトの改善のための提案がある場合、または問題を見つけた場合は、フィードバックを提供するか、GitHubの問題を介してプルリクエストを送信してください。
このプロジェクトは、MITライセンスに基づいてオープンソースがあります。このプロジェクトを自由に使用、変更、配布できますが、元のライセンスステートメントを保持する必要があります。
ご質問や提案がある場合は、お問い合わせください。
救済は、個人的な学習と研究の目的で設計されたオープンソースプロジェクトです。このプロジェクトを使用する場合は、次の免責事項に注意してください。
このプロジェクトを使用する前に、これらの免責事項を理解し、受け入れるようにしてください。これらの条件に同意しない場合は、このプロジェクトを使用しないでください。
ご理解とご支援ありがとうございます!