eunoia-plus:オープンドメインチッチャットシステム
Eunoia-Plusは、複数のAIモジュールを統合して動的、インテリジェント、自然な会話を作成する高度なオープンドメインチッチャットシステムです。このシステムは、マルチモジュールアーキテクチャを使用して設計されており、天候、通貨など、幅広いドメインでユーザーの入力を理解して応答できるようにします。
特徴
モジュラーアーキテクチャ:システムは4つの重要なモジュールに分割されます。
- 自然言語理解(NLU) :微調整されたRobertaモデルを使用して、ユーザーの意図を検出し、必要な情報を高精度で抽出します。
- 意図の検証:XGBoostベースのモデルは、検出された意図の正確性を保証し、曖昧で重複する意図を効率的に処理します。
- Dialogue State Tracking(DST) :ルールベースとGPT-3.5の両方のターボメソッドの両方を使用して、会話状態を追跡し、会話フロー管理に柔軟性を提供します。
- 回答生成:ブルームモデルとT5モデルを使用して、コヒーレントでコンテキスト的に適切な応答を生成します。
さまざまな意図構造のサポート:4つのカテゴリの意図を処理します。
- スロットのない意図。
- オプションのスロットを備えた意図。
- 1つの必須スロットを必要とする意図。
- 複数の必須スロットを必要とする意図。
高精度:システムは、いくつかのメトリックにわたって高い精度を提供します。
- NLUモジュール:96%の意図検出精度、97%スロット充填精度。
- 意図検証:95%の精度。
- ダイアログ状態追跡:GPTベースのメソッドを介したコンテキスト精度が向上した、ルールベースの方法を使用した92%の精度。
- 回答生成:会話の履歴と状態を活用することにより、関連する応答を生成します。
使用法
- このシステムは、オープンドメインデータセットに基づいてマルチターン会話を処理するように構築されています。
- ユーザーは、コマンドラインを介してシステムと対話したり、他の会話プラットフォームまたはアプリケーションに統合したりできます。
- モジュラーアーキテクチャにより、カスタマイズが簡単になり、さまざまなドメインや意図に適応できます。
プロジェクト構造
nlu/ :自然言語理解モジュールとそのデータのコードが含まれています。-
api/ :ファインチューニングモデルをサーバーとして呼び出すためのAPIコードが含まれています。 -
intent_validation/ :検出された意図を検証するXgboostベースのモジュール。 -
dst/ :ルールベースおよびGPT-3.5ベースのダイアログ状態追跡実装。 -
answer_generation/ :BloomおよびT5を含む回答生成モデル。
使用されたモデル
- Roberta :意図の検出とスロット充填用。
- xgboost :意図の検証と信頼できる意図解決を確保するため。
- GPT-3.5ターボ:少ないショット学習を使用した高度な対話状態追跡用。
- Bloom and T5 :コンテキストに関連する応答を生成するため。
パフォーマンス
システムは、いくつかの重要なメトリックを使用して評価されています。
- 意図検出:96%の精度。
- スロットフィリング:97%の精度。
- 意図検証:95%の精度。
- 対話状態追跡:
- ルールベース:92%の状態精度。
- GPTベース:69.94%全体の精度(NLU出力)、100%流ency(会話フロー)。