В настоящее время, чтобы рассмотреть нагрузку на бэкэнд, бэкэнд поисковой системы был изменен на Flask
Тем не менее, его временная структура хранения CubeQl использует FASTAPI
Официальный веб -сайт: http://115.29.198.35 Электронная почта автора: [email protected]


Временная структура хранения для поиска румянца, реализация функций Redis, а также может отфильтровать URL-адреса Crawler через модуль фильтра Bloom и использовать его в качестве дедупликации
Оптимизация скорости ожидается с использованием vlang
Оптимизируйте проблему 404 по -прежнему включение в ползание CatthCode с помощью распределенных сканеров, что увеличивает результаты поиска и увеличение веса (перенаправление) (перенаправление)
Mozilla/5,0 (совместимый; Verdantspider/1.0)
Добавьте некоторую необходимую функцию динамического обновления веса поисковой системы (выполнено)
Реализовать нечеткий поиск китайского языка-> пинин (необходимо создать новую таблицу картирования)
Реализовать сплит -базу данных
Преобразовать в PostgreSQL (сделано)
Статистика детали каждого поиска для легкого резюме (сделано)
Добавить распределенные замки, реализованные CubeQl
Реализуйте поисковые слова для сохранения в облаке, и сервер не требует многочисленных полей
Реализуйте звук после нажатия значка тома
Реализовать vlang вместо большинства функций Python и оптимизировать производительность
Реализуйте ежедневные поиск горячих точек
Реализуйте интеллектуальную резюме различных поисковых систем
Используйте контейнеры для управления средой, чтобы реализовать развертывание одного щелчка и операцию на один щелчок
Жизненные циклы для каждого отдельного индекса поиска, и вес будет снижен через некоторое время (для поддержания необходимы новые программы) (сделано)
Реализуйте Simhash и реализуйте дедупликацию веб -сайтов блогов, таких как CSDN
Поддерживает диверсифицированный поиск и более удобные фильтры
Справочная версия PostgreSQL составляет 11.10
Python> = 3,6
колба
FASTAPI == 0,54,1
psycopg2
Starlette
requests_html
jieba
Демжсон
bloomfilter_live
Гевент
├ описано. VSCODE
├Docs
├--Sources
│ ├aconfig
│ ├acceql
│ └--Pycache__
│ ├aclib
│ ├--Spider
│ └--PyCache __ │ ├ íaTatic
│ │ ├acsss
│ │ ├acimg
│ └--Music
│ ├actemplates
│ └--Pycache __
└acsql
Документы: регулярно хранить документы
Ресурсы: каталог хранилища исходного кода
Конфигурация: альтернативный каталог для файла конфигурации JSON (действительно вызван в корневом каталоге, и оптимизация структуры каталога еще не была завершена
CubeQL: каталог, в котором хранится исходный код, связанный с CubeQL
Паук: каталог для хранения сканеров
LIB: Требования к магазину
Статический: хранить статические файлы
Шаблоны: хранить файлы шаблонов
SQL: хранить альтернативные файлы SQL Alternate Table
Backend.py - File Backend поисковой системы
config.json - файл конфигурации, только файл JSON в каталоге ROOT, где работает код, вступает в силу
Может быть, есть некоторые библиотеки, которые не упоминаются, но в любом случае, что есть
Изменить пароль учетной записи базы данных и ip of config.json
Убедитесь, что PostgreSQL открыт
Запустить в каталоге CubeQL
Uvicorn Cubeql: App -Port 1278
Работать в каталоге ресурсов
Python Backend.py
Запустите его в каталоге Spider (вы можете открыть зеленый поиск, если не запускаете его)
Python cds-distributed.py
Доступ к тренду, вы можете подсчитать частота поиска всех ключевых слов
Написание системы подключения довольно просто.
Затем создайте новый index.html и package.json в папке расширений.
Package.json