LLMとRAGを備えたQA(検索拡張生成)
このプロジェクトは、PGVectorを使用して、大規模な言語モデル(LLMS)とAmazon Aurora PostgreSQLを使用したアプリケーションに答える質問です。 RAG(検索拡張生成)アプローチを使用したアプリケーションは、エンタープライズナレッジベースまたはコンテンツからのユーザーの要求に最も関連する情報を取得し、プロンプトとしてのユーザーの要求とともにコンテキストとしてバンドルし、Genai応答を取得するためにLLMに送信します。
LLMSには、入力プロンプトの最大ワードカウントに関する制限があります。したがって、企業の数千または数百万のドキュメント間で適切なパッセージを選択すると、LLMの精度に直接影響します。
このプロジェクトでは、PGVectorを備えたAmazon Aurora PostgreSQLが知識ベースに使用されています。
全体的なアーキテクチャは次のようなものです。
全体的なワークフロー
- CDKスタックを展開します(詳細については、こちらを参照してください)。
- プライベートVPCのSagemaker Studio。
- テキスト生成のセージメーカーエンドポイント。
- 埋め込みを生成するためのセージメーカーのエンドポイント。
- 埋め込みを保存するためのAmazon Aurora PostgreSQLクラスター。
- AWS Secrets Manangerに保存されているAWS Secretsに保存されているAURORA POSTGRESQL Clusterのアクセス資格情報(ユーザー名とパスワード)は
RAGPgVectorStackAuroraPostg-xxxxxxxxxxxxなどの名前です。
- Sagemaker StudioでJupyterlabを開いてから、新しいターミナルを開きます。
- 端末で次のコマンドを実行して、このプロジェクトのコードリポジトリをクローン化します。
git clone --depth=1 https://github.com/aws-samples/rag-with-amazon-postgresql-using-pgvector.git
- Open
data_ingestion_to_pgvector.ipynbノートブックと実行します。 (詳細については、こちらをご覧ください) - Riremlitアプリケーションを実行します。 (詳細については、こちらをご覧ください)
参照
- 自然言語処理、チャットボット、センチメント分析のためにPGVectorとAmazon Aurora PostgreSQLを活用する(2023-07-13)
- Amazon Aurora PostgreSQL互換版およびPostgreSQLのAmazon RDS(2023-11-06)でPGVectorでのHNSWのインデックス作成と検索を加速
- PGVECTORインデックスを使用した生成AIアプリケーションを最適化:IVFFLATおよびHNSWテクニックへの深いダイビング(2024-03-15)
- 最適化された読み取りとPGVector(2024-02-09)を使用して、Amazon Auroraでの生成AIワークロードのパフォーマンスを向上させる
- Amazon SagemakerとPGVector(2023-05-03)を使用したPostgreSQLでのAI搭載検索の構築
- Amazon Sagemaker Studio(2023-04-11)で河川照明アプリを構築する
- Amazon Kendra、Langchain、および大規模な言語モデル(2023-05-03)を使用して、エンタープライズデータに高精度の生成AIアプリケーションを迅速に構築します
- (Github)Amazon Kendra Retiriverサンプル
- Amazon Sagemaker Jumpstart(2023-05-02)のファンデーションモデルを使用した検索拡張生成を使用した質問に答える質問
- Amazon Sagemaker JumpstartのAmazon Sagemaker Studio(2023-06-27)の独自の基礎モデルを使用する
- Langchain-言語モデルを搭載したアプリケーションを開発するためのフレームワーク。
- Streemlit-データアプリを構築および共有するためのより高速な方法
- rag-with-amazon-kendra-and-sagemaker-大規模な言語モデル(LLMS)とAmazon Kendraを使用したアプリケーションに答える質問
- rag-with-with-amazon-opensearch-and-sagemaker-大規模な言語モデル(LLMS)とAmazon Opensearchサービスを使用したアプリケーションに答える質問
- rag-with-with-amazon-opensearch-server-custage nows nessering nestering application with Large Language Models(LLMS)およびAmazon OpenSearch ServerLessサービス
- pgvector changelog-v0.4.0(2023-01-11)
ベクターの最大寸法の増加は、 1024から16000になりました
1024から2000にインデックスの最大寸法の増加
安全
詳細については、貢献を参照してください。
ライセンス
このライブラリは、MIT-0ライセンスに基づいてライセンスされています。ライセンスファイルを参照してください。