rag with amazon postgresql using pgvector and sagemaker Download - rag with amazon postgresql using pgvector and sagemaker Código Download

rag with amazon postgresql using pgvector and sagemaker

Outro código-fonte

1.0.0

Baixar

QA com LLM e RAG (geração aumentada de recuperação)

Este projeto é um aplicativo de resposta a perguntas com grandes modelos de idiomas (LLMS) e Amazon Aurora PostgreSQL usando o PGVector. Um aplicativo usando a abordagem RAG (geração aumentada de recuperação) recupera as informações mais relevantes para a solicitação do usuário da base ou conteúdo do conhecimento corporativo, agrupa -o como contexto junto com a solicitação do usuário como um prompt e o envia ao LLM para obter uma resposta Genai.

Os LLMs têm limitações em torno da contagem máxima de palavras para o prompt de entrada, escolhendo as passagens corretas entre milhares ou milhões de documentos na empresa, tem um impacto direto na precisão do LLM.

Neste projeto, a Amazon Aurora PostgreSQL com PGVector é usada para base de conhecimento.

A arquitetura geral é assim:

Fluxo de trabalho geral

Implante as pilhas CDK (para mais informações, veja aqui).
- Um estúdio de sagemaker em um VPC particular.
- Um terminal de sagemaker para geração de texto.
- Um terminal de sagema para gerar incorporações.
- Um cluster Amazon Aurora PostgreSQL para armazenar incorporações.
- As credenciais de acesso da Aurora PostGresql Cluster (nome de usuário e senha) armazenadas no AWS Secrets Mananger como um nome como RAGPgVectorStackAuroraPostg-xxxxxxxxxxxx .
Abra o Jupyterlab no Sagemaker Studio e depois abra um novo terminal.

Execute os seguintes comandos no terminal para clonar o repositório de código para este projeto:

 git clone --depth=1 https://github.com/aws-samples/rag-with-amazon-postgresql-using-pgvector.git

Open data_ingestion_to_pgvector.ipynb Notebook e execute -o. (Para mais informações, veja aqui)
Execute o aplicativo StreamLit. (Para mais informações, veja aqui)

Referências

Alavancar PGVector e Amazon Aurora PostgreSQL para processamento de linguagem natural, chatbots e análise de sentimentos (2023-07-13)
Acelere a indexação e a pesquisa de HNSW com o PGVector na Amazon Aurora PostgreSQL Compatível Edition e Amazon RDS for PostgreSQL (2023-11-06)
Otimize aplicações generativas de IA com indexação PGVector: um mergulho profundo nas técnicas IVFFLAT e HNSW (2024-03-15)
Melhore o desempenho de cargas de trabalho de IA generativas na Amazon Aurora com leituras e pgvector otimizados (2024-02-09)
Construindo pesquisas movidas a IA no PostgreSQL usando o Amazon Sagemaker e o PGVector (2023-05-03)
Construa aplicativos Streamlit no Amazon Sagemaker Studio (2023-04-11)
Construa rapidamente aplicativos de IA generativos de alta precisão em dados corporativos usando Amazon Kendra, Langchain e grandes modelos de linguagem (2023-05-03)
- (Github) Amazon Kendra Retriver Amostras
Resposta de perguntas usando a geração aumentada de recuperação com modelos de fundação no Amazon Sagemaker Jumpstart (2023-05-02)
Use modelos de fundação proprietários do Amazon Sagemaker Jumpstart no Amazon Sagemaker Studio (2023-06-27)
Langchain - Uma estrutura para o desenvolvimento de aplicativos alimentados por modelos de idiomas.
Streamlit - uma maneira mais rápida de construir e compartilhar aplicativos de dados
Rag-With-Amazon-Kendra-and-Sagemaker-Aplicação de perguntas com grandes modelos de idiomas (LLMS) e Amazon Kendra
Rag-With-Amazon-OpenSearch-e-Sagemaker-Aplicação de perguntas de perguntas com grandes modelos de idiomas (LLMS) e Amazon OpenSearch Service
Rag-with-amazon-OpenSearch-Serverless-Aplicação de perguntas Aplicativo com grandes modelos de idiomas (LLMS) e Amazon OpenSearch Serverless Service
PGVector Changelog-v0.4.0 (2023-01-11)
Dimensões máximas aumentadas para o vetor de 1024 a 16000
Aumento das dimensões máximas do índice de 1024 a 2000