LLM 및 RAG가있는 QA (검색 증강 세대)
이 프로젝트는 PGVECTOR를 사용하여 대형 언어 모델 (LLMS)과 Amazon Aurora PostgreSQL을 사용한 응용 프로그램에 대한 질문입니다. RAG (검색 증강 생성) 접근법을 사용한 응용 프로그램은 Enterprise Knowledge Base 또는 Content의 사용자의 요청과 가장 관련된 정보를 검색하고 사용자의 요청과 함께 프롬프트로 컨텍스트로 묶은 다음 LLM으로 보내 Genai 응답을 얻습니다.
LLM은 입력 프롬프트에 대한 최대 단어 수에 제한이 있으므로 기업의 수천 또는 수백만 문서 중 올바른 구절을 선택하면 LLM의 정확도에 직접적인 영향을 미칩니다.
이 프로젝트에서는 PGVector가있는 Amazon Aurora PostgreSQL이 지식 기반에 사용됩니다.
전체 아키텍처는 다음과 같습니다.
전반적인 워크 플로
- CDK 스택을 배포하십시오 (자세한 내용은 여기 참조).
- 개인 VPC의 Sagemaker Studio.
- 텍스트 생성을위한 Sagemaker 엔드 포인트.
- 임베딩을 생성하기위한 Sagemaker 엔드 포인트.
- 임베딩 저장을위한 Amazon Aurora PostgreSQL 클러스터.
- Aurora PostgreSQL Cluster의 액세스 자격 증명 (사용자 이름 및 비밀번호)은 AWS Secrets Mananger에 저장되어
RAGPgVectorStackAuroraPostg-xxxxxxxxxxxx 와 같은 이름으로 저장됩니다.
- Sagemaker Studio에서 jupyterlab을 열고 새 터미널을 엽니 다.
- 이 프로젝트의 코드 저장소를 복제하려면 터미널에서 다음 명령을 실행하십시오.
git clone --depth=1 https://github.com/aws-samples/rag-with-amazon-postgresql-using-pgvector.git
data_ingestion_to_pgvector.ipynb 노트북을 엽니 다. (자세한 내용은 여기를 참조하십시오)- 간단한 응용 프로그램을 실행하십시오. (자세한 내용은 여기를 참조하십시오)
참조
- 자연 언어 처리, 챗봇 및 감정 분석을위한 PGVECTOR 및 AMAGON AURORA POSTRESQL 레버리지 (2023-07-13)
- Amazon Aurora Postgresql-Compatible Edition에서 PGVECTOR로 HNSW 인덱싱 및 검색을 가속화하고 PostgreSQL의 Amazon RDS (2023-11-06)
- PGVECTOR 인덱싱을 사용하여 생성 AI 애플리케이션 최적화 : IVFFLAT 및 HNSW 기술에 대한 깊은 다이빙 (2024-03-15)
- 최적화 된 읽기 및 PGVECTOR (2024-02-09)를 사용하여 Amazon Aurora의 생성 AI 워크로드의 성능을 향상시킵니다.
- Amazon Sagemaker 및 PGVector (2023-05-03)를 사용하여 PostgreSQL에서 AI 구동 검색 구축
- Amazon Sagemaker Studio (2023-04-11)에서 Streamlit 앱 구축
- Amazon Kendra, Langchain 및 대형 언어 모델 (2023-05-03)을 사용하여 엔터프라이즈 데이터에 대한 고 진수력 생성 AI 응용 프로그램을 신속하게 구축하십시오.
- (Github) Amazon Kendra Retriver 샘플
- Amazon Sagemaker Jumpstart (2023-05-02)의 기초 모델과 함께 검색 증강 세대를 사용한 질문 답변
- Amazon Sagemaker Studio의 Amazon Sagemaker Jumpstart의 독점 기초 모델 사용 (2023-06-27)
- Langchain- 언어 모델로 구동되는 응용 프로그램을 개발하기위한 프레임 워크.
- Streamlit- 데이터 앱을 구축하고 공유하는 더 빠른 방법
- Rag-with-Amazon-Kendra and-Sagemaker- 큰 언어 모델 (LLM) 및 Amazon Kendra를 사용한 응용 프로그램에 대한 질문에 대한 질문
- Rag-With-Amazon-Opensearch and-Sagemaker- 큰 언어 모델 (LLM) 및 Amazon OpenSearch Service를 사용한 응용 프로그램에 대한 질문에 대한 질문
- rag-with-Amazon-Opensearch-Serverless- 대형 언어 모델 (LLMS) 및 Amazon OpenSearch Serverless 서비스가있는 질문 응답 응용 프로그램
- Pgvector ChangeLog-V0.4.0 (2023-01-11)
벡터의 최대 치수가 1024 에서 16000 으로 증가했습니다
인덱스의 최대 치수가 1024 에서 2000 으로 증가했습니다
보안
자세한 내용은 기여를 참조하십시오.
특허
이 라이브러리는 MIT-0 라이센스에 따라 라이센스가 부여됩니다. 라이센스 파일을 참조하십시오.