Atualmente, para considerar a carga do back -end, o back -end do mecanismo de pesquisa foi alterado para o Flask
No entanto, sua estrutura de armazenamento temporária CubeQL usa FASTAPI
Site oficial: http://115.29.198.35 E -mail do autor: [email protected]


Uma estrutura de armazenamento temporária para pesquisa de blush, implementando funções do tipo Redis e também pode filtrar URLs de rastreador através do módulo de filtro Bloom e usá-lo como desduplicação
A otimização de velocidade é esperada usando Vlang
Otimize o problema do 404 Still Inclusion in StatusCode Rastreling por rastreadores distribuídos, o que aumenta os resultados da pesquisa.
Mozilla/5.0 (compatível; verdantspider/1.0)
Adicione algumas função de atualização dinâmica do peso do mecanismo de pesquisa (Concluído)
Implementar pesquisa difusa de chinês-> pinyin (precisa criar uma nova tabela de mapeamento)
Implementar armazenamento de banco de dados dividido
Converter para PostgreSQL (feito)
Estatísticas Os detalhes de cada pesquisa por resumo fácil (feito)
Adicionar bloqueios distribuídos implementados pelo CubeQL
Implementar palavras de pesquisa para salvar na nuvem, e o servidor não requer vários rastreamentos
Implementar o áudio depois de clicar no ícone de volume
Implemente o VLANG em vez da maioria das funções do Python e otimize o desempenho
Realize pontos quentes de pesquisa diária
Implementar resumo inteligente de vários mecanismos de pesquisa
Use recipientes para gerenciar o ambiente para realizar a implantação de um clique e operação com um clique
Ciclos de vida para cada índice único da pesquisa e o peso será reduzido após um tempo (novos programas são necessários para manter) (concluído)
Implementar Simhash e implementar a desduplicação de sites de blogs como CSDN
Suporta pesquisas diversificadas e filtros mais amigáveis
A versão de referência PostgreSQL é 11.10
python> = 3.6
balão
FASTAPI == 0.54.1
Psycopg2
Starlette
solicitações_html
Jieba
Demjson
Bloomfilter_live
Gevent
├─.vscode
├─Docs
├─Resources
│ ├─Config
│ ├─Cubeql
│ └─__pycache__
│ ├─lib
│ ├─spider
│ └─__pycache __ │ ├ ├ estático
│ ├ ├—Css
│ │ ├─Img
│ └─ Music
│ ├—Templates
│ └─__pycache __
└─SQL
Documentos: armazenar regularmente documentos
Recursos: diretório de armazenamento de código -fonte
Config: o diretório alternativo para o arquivo de configuração JSON (realmente chamado no diretório raiz, e a otimização da estrutura do diretório ainda não foi concluída
CubeQL: um diretório que armazena o código-fonte relacionado ao CubeQL
Spider: Diretório para armazenar rastreadores
Lib: Requisitos de armazenamento
estático: armazenar arquivos estáticos
Modelos: Arquivos de modelo de armazenamento
SQL: armazenar arquivos SQL de criação de tabela alternativa
back -end.py - arquivo de back -end do mecanismo de pesquisa
Config.json - arquivo de configuração, apenas o arquivo json no diretório raiz onde o código está em execução entra em vigor
Talvez existam algumas bibliotecas no ambiente que não são mencionadas, mas de qualquer maneira, o que há para instalar
Modifique a senha da conta do banco de dados e o IP do config.json
Verifique se o PostgreSQL está aberto
Execute no diretório CubeQL
Uvicorn CubeQL: App --port 1278
Executar no diretório de recursos
python backend.py
Execute -o no diretório Spider (você pode abrir a pesquisa verde se não executá -lo)
python cds-distribued.py
Ao acessar /tendências, você pode contar a frequência de pesquisa de todas as palavras -chave
A gravação de um sistema de plug-in é bastante simples.
Em seguida, crie um novo index.html e package.json na pasta Extensions.
package.json