Download mdb search - mdb search código fonte download

mdb search

Outro código-fonte

1.0.0

Baixar

Pesquisa de banco de dados, pesquisa de relevância, pesquisa semântica de incorporação com mongodb

Tl; dr: um aplicativo hackeado da web com um back -end de atlas do MongoDB usando diferentes consultas de pesquisa.

Introdução

Oferecer uma ótima experiência de pesquisa de usuário em aplicativos pode ser difícil, mas não precisa ser.

Este aplicativo combina várias técnicas de pesquisa disponíveis no MongoDB em um conjunto de dados operacionais de filmes. O MongoDB é um banco de dados de documentos muito popular, conhecido por seus poderosos recursos transacionais e analíticos em dados estruturados e semiestruturados em uma estrutura do tipo JSON. A adição de pesquisa de relevância e pesquisa vetorial semântica na mesma plataforma e linguagem de consulta é muito fácil e simples de usar, sem muita complexidade. Como um banco de dados vetorial, agora também armazena dados não estruturados, como texto, imagens ou áudio, em incorporações vetoriais (vetores de alta dimensão) para facilitar a localização e recuperação de objetos semelhantes rapidamente.

Pesquisa de banco de dados transacional ( MongoDB ),
Pesquisa de relevância com o MongoDB Atlas Search ( Lucene ),
Pesquisa semântica com pesquisa vetorial de atlas de MongoDB com base em incorporações para texto ( text-embedding-ada-002 ),
Pesquisa semântica com pesquisa vetorial de atlas de MongoDB com base em incorporações para imagens ( clip-ViT-B-32 ),

A busca no ATLAS permite a pesquisa de relevância e os recursos de pontuação com base nos índices Lucene de código aberto. Aqui, eu o uso para pesquisar filmes relevantes com suporte ao idioma e correção de digitação.

O enredo de texto de cada filme é executado pela API de incorporação do OpenAI e aquelas incorporações text-embedding-ada-002 são armazenadas em MongoDB. O prompt do usuário é incorporado e usado para consultar o banco de dados vetorial para conteúdo semelhante. Você pode pesquisar em sua entrada ou fazer uma pesquisa de similaridade com base no enredo de um filme existente. Pesquisa semântica de texto

A imagem do pôster de cada filme é interpretada pelo clip-ViT-B-32 . Essas incorporações de imagem são armazenadas em MongoDB. O usuário pode encontrar filmes com imagens de pôsteres semelhantes à sua consulta. Pesquisa de imagem semântica

A estrutura do documento parece a seguir. Em azul, você tem os campos, objetos aninhados e matrizes com dados operacionais. O azul é consultado com a pesquisa de banco de dados e a pesquisa de relevância da Pesquisa de Atlas. Esses projetos adicionam os campos em amarelo: uma representação Base64 do pôster do filme, incorporações de textos ADA OpenAI e incorporação de imagem de clipes, consultada com a busca de vetores do Atlas.

Estrutura de documentos

Ambiente de configuração

Você precisa de python3 e pip .

 python3 --version
python3 -m ensurepip --upgrade
pip3 install -r requirements.txt

Você precisa de um cluster MongoDB Atlas . Este pode ser um cluster gratuito, criado no cloud.mongodb.com. Verifique se o acesso ao banco de dados e o acesso à rede permite fazer uma conexão com o banco de dados. Nota Os clusters gratuitos têm uma limitação de tamanho e desempenho, fique à vontade para executá -lo em um pequeno cluster pago com muito mais dados.

Você precisa definir algumas variáveis de ambiente local. O modelo é .env.example que você pode copiar para o seu arquivo .env local.

 MDB_CONN=<YOUR MongoDB Atlas connection string>
DB="sample_mflix"
COLL="embedded_movies"
OPENAI_API_KEY=<YOUR OpenAI API key>

Preparando os dados

Clone o repo MDB-Search-Data.

Lá, você recebe duas opções: restaurando de backup ou geração de incorporação localmente. A restauração do backup leva menos de 1 minuto.

Habilitando a pesquisa de relevância e a pesquisa vetorial no MongoDB Atlas

No Atlas, na Search tab visualização do cluster, digite a seguinte configuração JSON. Use o nome do índice default e certifique -se de criá -lo na coleção embedded_movies . Esta é a mágica que permitirá a pesquisa dinâmica de texto completo nos campos, além de permitir os índices de pesquisa vetorial. Nenhuma cópia de dados necessária: O

 {
    "mappings": {
        "dynamic": true,
        "fields": {
            "plot_embedding": {
                "dimensions": 1536,
                "similarity": "cosine",
                "type": "knnVector"
            },
            "poster_embedding": {
                "dimensions": 512,
                "similarity": "cosine",
                "type": "knnVector"
            }
        }
    }
}

Hora de executá -lo

Este é um aplicativo web python3 de frasco.

Inicie o aplicativo Flask como este

 flask --app app run

Ou com um ajudante, basta usar python como este

 python app.py

Você pode acessar o aplicativo da web em http://localhost:8080 .

Você pode agora:

Use a pesquisa completa de texto no campo de entrada para encontrar 'qualquer conjunto aleatório de filmes com pesquisa de relevância
Use a pesquisa de incorporação de texto do OpenAI para encontrar filmes semelhantes ao sentimento de texto em que você entra, parece exótico!
Clique no botão em um dos filmes e veja 'pôsteres de filmes semelhantes', veja o que acontece :)

Confie no ML e no modelo de incorporação. Você consegue adivinhar por que essas fotos são semelhantes?

Expandir

Informações adicionais

Versão 1.0.0
Tipo Outro código-fonte
Data da Última Atualização 2025-03-07
tamanho 1MB
Vindo de Github

Aplicativos Relacionados

Pesquisa de palavras 800

2024-11-08
azure search python samples

2024-11-05
Versão mais recente do jogo de quebra-cabeça de palavras de pesquisa de palavras

2024-07-11
Versão mais recente do jogo Word Search para crianças

2023-10-08
Liehuo! Pesquisar Pesquisa em inglês

2011-01-07
Visualizador MDB Plus

2009-06-22

Recomendado para você

chat.petals.dev

Outro código-fonte

1.0.0
GPT Prompt Templates

Outro código-fonte

1.0.0
GPTyped

Outro código-fonte

GPTyped 1.0.5
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3
Google Dorks

Outro código-fonte

1.0
shepherd

Outro código-fonte

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Outro código-fonte

v1.1.0-rc-3

Informações Relacionadas Todos