Entenda a pesquisa de texto completo com o Postgres
Piotr Lewandowski, @ConstJs
Tabela de conteúdo
- Crie tabelas de Demo DB
- STEMMER - Building Documents
- Pesquisa - Construindo consultas
- Práticas de desempenho
- Definindo peso e classificação
- Melhorar a qualidade da pesquisa
- Leitura adicional
Quando a pesquisa de texto completo?
- Pesquise por conteúdo criado por pessoas (não programadores)
- Dividir fragmentos cada vez mais importantes do documento
- Pesquisando dumps de banco de dados de WikiLeaks
Por que não apenas Regex?
Regex é bom encontrar apenas idiomas simples e finitos
Impotente para gramática
Lento (pode ser melhorado com os índices de trigrama)
Muitas armadilhas, mesmo para idiomas simples como HTML
Complicado de manter, por exemplo
^(?=[A-Z0-9][A-Z0-9@._%+-]{5,253}$)[A-Z0-9._%+-]{1,64}@(?:(?=[A-Z0-9-]{1,63}.)[A-Z0-9]+(?:-[A-Z0-9]+)*.){1,8}[A-Z]{2,63}$
Por que postgres?
- Muito rico em recursos
- Flexível e extensível
- Talvez você já tenha
- Ponto de entrada baixo
- Se sua pilha de tecnologia já estiver super-engenhada