| 名前 | 説明 | 言語 | 製品 | page_type | urlfragment | |||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
データとチャット - ソリューションアクセラレータ(Python) | Pythonを使用してOpenAIおよびAI検索を使用してデータとチャットします。 |
|
| サンプル | data-solution-acceleratorでチャット |
データソリューションアクセラレータリポジトリとのチャットへようこそ! Data Solution Acceleratorとのチャットは、 Azure AI検索と大規模な言語モデル(LLM)の機能を組み合わせて、会話型検索エクスペリエンスを作成する強力なツールです。このソリューションアクセラレータは、Azure OpenAI GPTモデルとデータから生成されたAzure AI検索インデックスを使用します。これは、Webアプリケーションに統合されて、検索クエリにスピーチツーテキスト機能を含む自然言語インターフェイスを提供します。ユーザーは、ファイルをドラッグアンドドロップしたり、ストレージを指したり、テクニカルセットアップを処理してドキュメントを変換できます。このテクノロジーの使用を加速するために、すべてを独自のサブスクリプションに展開できます。

このリポジトリは、自然言語でデータを照会したいユーザーにエンドツーエンドのソリューションを提供します。これには、複数のファイルタイプのための適切に設計された摂取メカニズム、簡単な展開、メンテナンスのためのサポートチームが含まれています。加速器は、プッシュまたはプルの摂取の両方を示します。オーケストレーションの選択(セマンティックカーネル、ラングチェーン、OpenAI関数、または迅速なフロー)であり、RAGパターンを実装するために必要な最小コンポーネントである必要があります。データの実験や評価なしに、生産に入れることを意図したものではありません。次の機能を提供します。
データのAzure Openaiがすぐに提供されるものを超えてシナリオをカスタマイズする必要がある場合は、このリポジトリを使用してください。デフォルトでは、このリポジトリには、チャンクサイズ、オーバーラップ、検索/検索タイプ、システムプロンプトを含むがこれらに限定されない特定のRAG構成セットが付属しています。このリポジトリを使用する前に、取得/検索とデータの回答の生成を評価し、それに応じてこれらの構成を調整することが重要です。 RAG評価を理解して実行するための出発点については、RAG実験アクセラレータを調べることをお勧めします。
ここで提示されているアクセラレータは、いくつかのオプションを提供します。たとえば、次のようです。
*Azure OpenaiとAI検索デモを使用したChatGpt +エンタープライズデータを見たことがありますか?実験したい場合:プロンプトで再生し、RAGパターンのさまざまな実装アプローチを理解し、さまざまな機能がRAGパターンと相互作用する方法を確認し、RAG展開に最適なオプションを選択するには、そのレポをご覧ください。
Azureが提供するいくつかの機能、利用可能なGitHubデモサンプルとこのレポを使用したいくつかの機能を備えた比較テーブルは、使用するものを決定する必要がある場合にガイダンスを提供できます。
| 名前 | 機能またはサンプル? | それは何ですか? | いつ使用するのですか? |
|---|---|---|---|
| 「データとチャット」ソリューションアクセラレータ - (このレポー) | Azureサンプル | Azure AI検索を取得者として使用するエンドツーエンドのベースラインラグパターンサンプル。 | このサンプルは、Azureが提供するRAGパターンの実装がビジネス要件を満たすことができない場合、開発者が使用する必要があります。このサンプルは、ソリューションをカスタマイズする手段を提供します。開発者は、要件を満たすために独自のコードを追加し、個々の会社のポリシーに従ってベストプラクティスに適応する必要があります。 |
| あなたのデータにazure openai | Azure機能 | Azure Openai Serviceは、Azure AI StudioのREST APIまたはWebベースのインターフェイスを使用して、データに接続するソリューションを作成してAzure Openai ChatGPTモデルとAzure AI検索を可能にするソリューションを作成する、すぐに使用できるエンドツーエンドのRAG実装を提供します。 | これは、Azure AI Search Retrieverを使用したAzure Openaiサービスのエンドツーエンドソリューションが必要な開発者にとって最初のオプションである必要があります。サポートされているデータソース、Azure OpenaiサービスのChatGPTモデル、およびエンタープライズアプリケーションのニーズを構成するために必要な他のAzureリソースを選択するだけです。 |
| Azure Machine Learningプロンプトフロー | Azure機能 | AzureのRAG機械学習は、大規模な言語モデルとベクトル化のためのAzure Openaiサービスと統合することにより有効になります。ベクターストアとしてのFAISSおよびAzure AI検索のサポートと、データチャンキング用のLangchainなどのオープンソースの提供、ツール、フレームワークのサポートが含まれています。 Azure Machine Learning Prompt Flowは、データ生成をテストし、プロンプトの作成を自動化し、迅速な評価メトリックを視覚化し、パイプラインを使用してRAGワークフローをMLOPに統合する機能を提供します。 | 開発者は、LLMベースのAIアプリケーションの開発サイクルに関与するプロセスをさらに制御する必要がある場合、Azure Machine学習プロンプトフローを使用して実行可能なフローを作成し、大規模なテストを通じてパフォーマンスを評価する必要があります。 |
| Azure OpenaiおよびAI検索デモを使用したChatGpt +エンタープライズデータ | Azureサンプル | Azure AI検索をレトリバーとして使用するRAGパターンデモ。 | RAGパターンのエンドツーエンドのデモを使用または提示したい開発者は、このサンプルを使用する必要があります。これには、さまざまな検索モードを展開およびテストする機能、およびビジネスユースケースをサポートするプロンプトが含まれます。 |
| RAG実験アクセラレータ | 道具 | RAG実験アクセラレータは、Azure AI検索とRAGパターンを使用して実験と評価を実施するのに役立つ汎用性の高いツールです。 | RAG実験アクセラレータは、検索クエリの実験と評価とOpenAIからの応答の質を実行しやすく、より速くすることです。このツールは、さまざまな検索とOpenai関連のハイパーパラメーターのパフォーマンスをテストしたい研究者、データ科学者、および開発者に役立ちます。 |
注:現在のモデルにより、ユーザーはPDF、テキスト、Docxファイルなどの非構造化データについて質問することができます。サポートされているファイルタイプを参照してください。
社内の非構造化された企業データに対する調査を検討している会社の職員(従業員、幹部)は、自然言語を使用してこのアクセラレータを活用して、迅速に必要なものを見つけます。
このアクセラレータは、業界と役割全体でも機能し、内部の非構造化された企業データに対してCHATGPTエクスペリエンスで簡単に回答したい従業員に適しています。
技術管理者は、このアクセラレータを使用して、同僚に内部の非構造化された企業データに簡単にアクセスできるようにすることができます。管理者は、システムコンフィギュレーターをカスタマイズして、対象となるオーディエンスの応答を調整できます。
サンプルデータは、このアクセラレータを金融サービス業界(FSI)でどのように使用できるかを示しています。
このシナリオでは、ファイナンシャルアドバイザーは、Woodgrove Investmentsの新興市場の資金に関心を示している潜在的なクライアントとの会議の準備をしています。アドバイザーは、新興市場基金の全体的な目標と関連するリスクについての理解をリフレッシュすることにより、会議の準備をします。
Financial AdvisorがWoodgroveの新興市場の資金についてより多くの情報を得ているので、彼らはクライアントからのこのファンドに関する質問に応答するのに適しています。
さらに、このアクセラレータをどの業界で利用できるかを示すために、法的レビューおよび要約アシスタントシナリオを実装しました。法的レビューおよび要約アシスタントは、専門家がドキュメントの大規模なコレクションを効率的に管理し、対話するのに役立ちます。詳細については、契約レビューおよび要約アシスタントReadMeを参照してください。
注:このアクセラレータに含まれるサンプルデータの一部は、AIを使用して生成され、例示的な目的のみです。
サンプルデータは、このアクセラレータを、業界全体で従業員のオンボーディングシナリオに使用する方法を示しています。
このシナリオでは、新しく雇われた従業員が組織へのオンボーディングの過程にあります。ソリューションアクセラレータを活用して、彼女は組織の健康と退職の利益の広範な製品をナビゲートします。新しく統合されたチャット履歴機能により、彼らは以前の会話を再訪し、複数の研究の継続性とコンテキストを確保することができます。この機能により、新しい従業員は情報を効率的に収集および統合し、オンボーディングエクスペリエンスを合理化できます。詳細については、readmeを参照してください。

このソリューションアクセラレータは、複数のリソースを展開します。展開前に各コンポーネントのコストを評価します。
以下は、一部のリソースの価格設定の詳細へのリンクです。
2つの選択肢があります。 「Azureへの展開」は、コードをクリックする必要がないワンクリック展開を提供します。あるいは、開発者エクスペリエンスが必要な場合は、ローカル展開の指示に従ってください。
メインブランチから事前に構築されたコンテナを使用するデモは、このボタンをクリックして使用できます。
展開が完了したら、Azure App Serviceでアプリ認証を追加するAzure App Serviceに認証を追加する手順に従ってくださいAzure App Serviceで実行されています
注:デフォルトの構成は、バージョン0613を備えたOpenAIモデル「GPT-35-Turbo」を展開します。ただし、すべての場所がこのバージョンをサポートするわけではありません。バージョン0613をサポートしていない場所に展開する場合は、低いバージョンに切り替える必要があります。さまざまな地域でサポートされているバージョンを確認するには、GPT-35ターボモデルの可用性ページにアクセスしてください。
ドキュメントをアップロードできる管理者サイトに移動します。にあります:
https://web-{RESOURCE_TOKEN}-admin.azurewebsites.net/
{RESOURCE_TOKEN}は、展開中に一意に生成されます。これは、サブスクリプションとリソースグループの名前の組み合わせです。次に、データを摂取してデータを追加し、データを追加します。 /dataディレクトリにサンプルデータを見つけることができます。

Webアプリに移動して、データの上でチャットを開始します。 Webアプリは以下を見つけることができます。
https://web-{RESOURCE_TOKEN}.azurewebsites.net/


このソリューションアクセラレータは、次のリソースを展開します。それぞれの機能を理解することが重要です。以下は、それぞれのドキュメントへのリンクです。
このリポジトリは、MITライセンスの下でライセンスされています。
/データフォルダーの下のデータセットは、CDLA-Permissive-2ライセンスの下でライセンスされています。
このソフトウェアでは、以下で特定されているように、独自の独自またはオープンソースライセンスによって管理されるサードパーティコンポーネントを使用する必要があり、ソフトウェアを使用するために、該当する各ライセンスの条件に準拠する必要があります。お客様は、このライセンスが、そのようなサードパーティの専有またはオープンソースコンポーネントを使用するライセンスまたはその他の権利を付与しないことを認め、同意します。
ソフトウェアに、Microsoft Azure Services(総称して「Microsoft製品とサービス」)を含むMicrosoft製品またはサービスで使用または派生したコンポーネントまたはコードが含まれる限り、そのようなMicrosoft製品およびサービスに適用される製品用語にも準拠する必要があります。お客様は、ソフトウェアを管理するライセンスが、Microsoft製品とサービスを使用するライセンスまたはその他の権利を付与しないことを認め、同意します。ライセンスまたはこのREADMEファイルには、Microsoft製品およびサービスの製品条件の条件に取って代わる、修正、終了、または変更されるものはありません。
また、目的地、エンドユーザー、および最終用途の制限を含む、ソフトウェアに適用されるすべての国内および国際的な輸出法および規制にも準拠する必要があります。輸出制限の詳細については、https://aka.ms/exportingをご覧ください。
お客様は、ソフトウェアとMicrosoft製品とサービス(1)が医療機器として設計、意図されていない、または提供されていないこと、および(2)は、専門的な医学的アドバイス、診断、治療、または判断の代わりに設計または意図されていないことを認め、専門的な医学的アドバイス、診断、治療、判断の代わりに使用するべきではありません。顧客は、顧客のオンラインサービスの実装のエンドユーザーに対する適切な同意、警告、免責事項、および謝辞を表示および/または取得することについて単独で責任を負います。
ソフトウェアがSoc 1およびSoc 2コンプライアンス監査の対象ではないことを認めます。 Microsoftテクノロジーや、ソフトウェアを含むそのコンポーネントテクノロジーは、認定された金融サービス専門家の専門的なアドバイス、意見、または判断の代替として意図されているか、利用可能にされていません。ソフトウェアを使用して、専門的な財務アドバイスや判断を交換、代用、または提供しないでください。
ソフトウェアにアクセスまたは使用することにより、ソフトウェアがサービスの中断、欠陥、エラー、またはその他の障害が人の死または重傷を負う可能性がある場合、または身体的または環境的損害(総称して、「高リスクの使用」)をもたらす可能性があること、および環境が中断された場合、エラーが発生した場合、エラーが発生した場合、エラーが発生した場合、ソフトウェアの場合、ソフトウェアが保証されます。一般的であろうと特定の業界であろうと、合理的、適切で、合法です。ソフトウェアにアクセスすることにより、ソフトウェアのリスクの高い使用があなた自身の責任であることをさらに認めます。