Actualmente, para considerar la carga del backend, el backend del motor de búsqueda se ha cambiado a Flask
Sin embargo, su estructura de almacenamiento temporal Cubeql usa FastAPI
Sitio web oficial: http://115.29.198.35 Correo electrónico del autor: [email protected]


Una estructura de almacenamiento temporal para la búsqueda de rubor, implementar funciones similares a Redis y también puede filtrar URL de rastreadores a través del módulo de filtro Bloom, y usarlo como deduplicación
Se espera que la optimización de la velocidad use VLANG
Optimice el problema de 404 aún la inclusión en el rastreo de código de estado por rastreadores distribuidos, lo que aumenta la clasificación de la página web de los resultados de búsqueda y el aumento de peso (redirección)
Mozilla/5.0 (compatible; Verdantspider/1.0)
Agregue una función de actualización dinámica de peso del motor de búsqueda necesaria (Hecho)
Implementar búsqueda difusa de chino-> pinyin (necesita crear una nueva mesa de mapeo)
Implementar el almacenamiento de bases de datos divididas
Convertir a PostgreSQL (hecho)
Estadísticas Los detalles de cada búsqueda de un resumen fácil (hecho)
Agregar bloqueos distribuidos implementados por Cubeql
Implementar palabras de búsqueda para guardar en la nube, y el servidor no requiere múltiples rastreos
Implemente el audio después de hacer clic en el icono de volumen
Implementar VLANG en lugar de la mayoría de las funciones de Python y optimizar el rendimiento
Date cuenta de los puntos calientes de búsqueda diaria
Implementar resumen inteligente de varios motores de búsqueda
Use contenedores para administrar el entorno para realizar una implementación de un solo clic y una operación de un solo clic
Ciclos de vida para cada índice único de la búsqueda, y el peso se reducirá después de un tiempo (se requieren nuevos programas para mantener) (Hecho)
Implementar Simhash e implementar la deduplicación de sitios web de blogs como CSDN
Admite búsqueda diversificada y filtros más fáciles de usar
La versión de referencia de PostgreSQL es 11.10
Python> = 3.6
matraz
Fastapi == 0.54.1
psycopg2
starlette
requests_html
jié
demJSON
BloomFilter_Live
gevento
├─
├─Docs
├─ RESOURES
│ ├─Config
│ ├─Cubeql
│ └─__pycache__
│ ├─lib
│ ├ ├ spider
│ └─__pycache __ │ ├─static
│ │ ├─CSS
│ │ ├─img
│ └─ Music
│ ├ ├templates
│ └─__pycache __
└─Sql
documentos: almacenar regularmente documentos
Recursos: directorio de almacenamiento de código fuente
config: el directorio alternativo para el archivo de configuración JSON (realmente llamado en el directorio raíz, y la optimización de la estructura del directorio aún no se ha completado
Cubeql: un directorio que almacena el código fuente relacionado con CUBEQL
Spider: directorio para almacenar rastreadores
lib: requisitos de la tienda
estática: almacenar archivos estáticos
Plantillas: almacenar archivos de plantilla
SQL: almacenar archivos SQL de creación de tabla alternativa
Backend.py - Archivo de backend del motor de búsqueda
config.json - archivo de configuración, solo el archivo json en el directorio raíz donde el código se ejecuta en vigencia
Tal vez hay algunas bibliotecas en el entorno que no se mencionan, pero de todos modos, ¿qué hay para instalar?
Modificar la contraseña de la cuenta de la base de datos y la IP de config.json
Asegúrese de que PostgreSQL esté abierto
Ejecutar en el directorio CUBEQL
UVICORN CUBEQL: APP -Port 1278
Ejecutar en el directorio de recursos
python backend.py
Ejecutarlo en el directorio de araña (puede abrir la búsqueda verde si no la ejecuta)
Python CDS-Distributed.py
Al acceder /tendencia, puede contar la frecuencia de búsqueda de todas las palabras clave
Escribir un sistema de complemento es bastante simple.
Luego cree un nuevo index.html y paquete.json en la carpeta Extensions.
paquete.json