QA com LLM e RAG (geração aumentada de recuperação)
Este projeto é um aplicativo de resposta a perguntas com grandes modelos de idiomas (LLMS) e Amazon Aurora PostgreSQL usando o PGVector. Um aplicativo usando a abordagem RAG (geração aumentada de recuperação) recupera as informações mais relevantes para a solicitação do usuário da base ou conteúdo do conhecimento corporativo, agrupa -o como contexto junto com a solicitação do usuário como um prompt e o envia ao LLM para obter uma resposta Genai.
Os LLMs têm limitações em torno da contagem máxima de palavras para o prompt de entrada, escolhendo as passagens corretas entre milhares ou milhões de documentos na empresa, tem um impacto direto na precisão do LLM.
Neste projeto, a Amazon Aurora PostgreSQL com PGVector é usada para base de conhecimento.
A arquitetura geral é assim:
Fluxo de trabalho geral
- Implante as pilhas CDK (para mais informações, veja aqui).
- Um estúdio de sagemaker em um VPC particular.
- Um terminal de sagemaker para geração de texto.
- Um terminal de sagema para gerar incorporações.
- Um cluster Amazon Aurora PostgreSQL para armazenar incorporações.
- As credenciais de acesso da Aurora PostGresql Cluster (nome de usuário e senha) armazenadas no AWS Secrets Mananger como um nome como
RAGPgVectorStackAuroraPostg-xxxxxxxxxxxx .
- Abra o Jupyterlab no Sagemaker Studio e depois abra um novo terminal.
- Execute os seguintes comandos no terminal para clonar o repositório de código para este projeto:
git clone --depth=1 https://github.com/aws-samples/rag-with-amazon-postgresql-using-pgvector.git
- Open
data_ingestion_to_pgvector.ipynb Notebook e execute -o. (Para mais informações, veja aqui) - Execute o aplicativo StreamLit. (Para mais informações, veja aqui)
Referências
- Alavancar PGVector e Amazon Aurora PostgreSQL para processamento de linguagem natural, chatbots e análise de sentimentos (2023-07-13)
- Acelere a indexação e a pesquisa de HNSW com o PGVector na Amazon Aurora PostgreSQL Compatível Edition e Amazon RDS for PostgreSQL (2023-11-06)
- Otimize aplicações generativas de IA com indexação PGVector: um mergulho profundo nas técnicas IVFFLAT e HNSW (2024-03-15)
- Melhore o desempenho de cargas de trabalho de IA generativas na Amazon Aurora com leituras e pgvector otimizados (2024-02-09)
- Construindo pesquisas movidas a IA no PostgreSQL usando o Amazon Sagemaker e o PGVector (2023-05-03)
- Construa aplicativos Streamlit no Amazon Sagemaker Studio (2023-04-11)
- Construa rapidamente aplicativos de IA generativos de alta precisão em dados corporativos usando Amazon Kendra, Langchain e grandes modelos de linguagem (2023-05-03)
- (Github) Amazon Kendra Retriver Amostras
- Resposta de perguntas usando a geração aumentada de recuperação com modelos de fundação no Amazon Sagemaker Jumpstart (2023-05-02)
- Use modelos de fundação proprietários do Amazon Sagemaker Jumpstart no Amazon Sagemaker Studio (2023-06-27)
- Langchain - Uma estrutura para o desenvolvimento de aplicativos alimentados por modelos de idiomas.
- Streamlit - uma maneira mais rápida de construir e compartilhar aplicativos de dados
- Rag-With-Amazon-Kendra-and-Sagemaker-Aplicação de perguntas com grandes modelos de idiomas (LLMS) e Amazon Kendra
- Rag-With-Amazon-OpenSearch-e-Sagemaker-Aplicação de perguntas de perguntas com grandes modelos de idiomas (LLMS) e Amazon OpenSearch Service
- Rag-with-amazon-OpenSearch-Serverless-Aplicação de perguntas Aplicativo com grandes modelos de idiomas (LLMS) e Amazon OpenSearch Serverless Service
- PGVector Changelog-v0.4.0 (2023-01-11)
Dimensões máximas aumentadas para o vetor de 1024 a 16000
Aumento das dimensões máximas do índice de 1024 a 2000
Segurança
Consulte contribuindo para mais informações.
Licença
Esta biblioteca está licenciada sob a licença MIT-0. Veja o arquivo de licença.