Use a tecnologia Golang+Goleveldb
Sistema de banco de dados Xiaobai embutido (sistema de banco de dados de índice de texto completo no nível de texto), "índice de texto completo" interno, sem necessidade de segmentação do dicionário, mas nunca há palavras que não podem ser pesquisadas.
A pesquisa foi gradualmente aprimorada e melhorada do "mecanismo de busca de Tripitaka de Qianlong" e "mecanismo de busca Siku Quanshu".
Ele pode ser usado para organizar uma grande quantidade de informações e possui uma função de pesquisa no nível do nível de texto.
Ele também pode ser usado apenas como um intermediário de pesquisa, como: pesquisa de site;
A tecnologia de segmentação de palavras atravessadas de forma independente, uma tecnologia inovadora para mecanismos de pesquisa, não requer segmentação de vocabulário e a taxa de sucesso da pesquisa é de 100%.
O sinônimo é o núcleo dos mecanismos de pesquisa. A segmentação de palavras são os olhos dos mecanismos de pesquisa. Sem olhos, você não pode ver nada e procurar nada.
No entanto, o banco de dados de vocabulário é basicamente difícil de aperfeiçoar, e é impossível alcançar a completude. Portanto, deve haver algumas palavras que não podem ser pesquisadas.
Especialmente para novas palavras, é impossível procurar novas palavras pela primeira vez, porque não há na biblioteca de vocabulário.
Se novas palavras não puderem ser pesquisadas, é equivalente a matar a força motriz da inovação, especialmente no campo de comércio eletrônico.
Mesmo que o gerenciamento de segmentação de palavras adicione novas palavras à biblioteca o mais rápido possível, para pesquisar, é necessário passar pela Traversal de todos os dados originais para obter o resultado.
Quanto maior o volume de dados do sistema, mais cauteloso é adicionar novas palavras e mais lento o tempo.
Pesquisa, abandona o dicionário.
Se a biblioteca de segmentação de palavras for os olhos de outros mecanismos de busca, esse olho é o olho nu. Os olhos que atravessam o particípio são os olhos celestiais.
Outras técnicas de segmentação de palavras levarão à probabilidade de não ser capaz de pesquisar os resultados devido à incompletude do banco de dados de segmentação de palavras. Em outras palavras, a taxa de sucesso da pesquisa é 100%.
Para dar um exemplo extremo:
Vire todos os artigos de cabeça para baixo e pesquise com as palavras invertidas também.
Outras técnicas de particípio de palavras provavelmente não conseguem procurar nada.
A taxa de sucesso da pesquisa é 100% na tecnologia de segmentação de palavras travessias.
Você pode personalizar a granularidade de pesquisa.
Motores de pesquisa comuns como Google e Baidu, a granularidade de pesquisa é o artigo inteiro.
Pesquisa, você pode personalizar para parágrafos, frases, etc.
Geralmente, a granularidade precisa é definida como uma frase.
Dezenas de bilhões de dados, resposta de milissegundos.
Como não há necessidade de segmentação de palavras e não há necessidade de analisar a segmentação de palavras, ele tem um desempenho mais alto do que os mecanismos de pesquisa com outras tecnologias de segmentação de palavras.
Adicione pesquisas em tempo real em tempo real.
Os dados de texto em nível 10G requer apenas dezenas de m de memória.
Abra o arquivo executável do sistema correspondente e execute -o.