Este projeto tem como objetivo explorar a pesquisa de banco de dados da WEAVIATE, usando o Coere para gerar vetores personalizados. Existem várias pesquisas que executamos usando as etapas listadas abaixo:
- Prompt Single Rag
- Pesquisa de vetor
Você precisará do seguinte:
- Uma chave de API teatral e URL
- uma chave da API coere
- Instale o Virtual Env, então:
pip install -r requirements.txt - Crie um arquivo .env e armazene seus creds
- Teste a conexão de banco de dados em execução:
python database/open_db_connection - Crie uma incorporação para o conjunto de dados:
python database/create_embeddings
- Isso criará um novo diretório dentro do seu diretório raiz chamado 'Scratch'.
- Em seguida, criará um arquivo .csv que contém todos os vetores gerados por coere
- Crie uma nova coleção em sua instância de tecelagem:
python database/create_collection
- Isso criará uma nova coleção chamada "MovieCustomvector"
- importar os dados:
python database/import_data - Consulta os dados:
python -m queries.{the_file_you_wish_to_query} - Para encerrar a conexão DB por qualquer motivo:
python database/close_db_connection
Mais informações sobre métodos de pesquisa
Pesquisa de RAG, também conhecida como 'generativa', consiste em 2 etapas:
- (WEAVIATE) Execute uma consulta de pesquisa em teatro para encontrar objetos relevantes.
- (Coere) Use um modelo de linguagem grande coere para gerar uma resposta com base nos resultados (na etapa anterior) e no prompt ou tarefa fornecida.
Testando pontos de extremidade de descanso
- Cole o URL do ponto de extremidade do REST WCD no navegador e anexa -o com
/v1 - Isso mostrará uma lista de pontos de extremidade RESTful que você pode acessar configurando o Postman.
- Weaviate usa um token do portador e você deve colar em seu wcd_api_key para autorização