Proyecto de gráfico de conocimiento web de código abierto
- Ratea la página china de la enciclopedia de Baidu
- Analización de triples y contenido web
- Construyendo un gráfico de conocimiento chino
- Construyendo un bot de enciclopedia (en construcción)
Actualización 20200720
Referencia de implementación en Windows Cómo implementar en Windows, ¡gracias a LMY-NLP0701!
Actualización 20191121
- Migrar el código al marco de rastreadores Scrapy
- Extracción optimizada de algunos códigos
- Migración de persistencia de datos a MongoDB
- Se corrigió el problema de la falla de chatbot
- Abra la interfaz de backend neo4j para ver el efecto de formación de gráficos de conocimiento
Consejos
- Si se trata de un problema del proyecto, solicite un problema.
- Si implica una divulgación inconveniente, envíe un correo electrónico.
- Chatbot, visite el enlace
- El enlace de acceso al gráfico de conocimiento de la enciclopedia moldeada, nombre de usuario: neo4j, contraseña: 123. Los efectos son los siguientes:

ambiente
- Python 3.6
- Re: URL Match regular
- Scrapy: rastreador web y análisis web
- Neo4j: base de datos de gráficos de conocimiento, consulte el enlace para la instalación
- PIP Instale Neo4J-Driver: controlador Neo4J Python
- PIP Instale Pymongodb: soporte de Python para MongoDB
- MongoDB Base de datos: enlace de referencia de instalación
Ejecución del código:
cd WEB_KG/baike
scrapy crawl baike
Interfaz de ejecución (presione Ctrl+C para detener): 
Renderizaciones de gráficos de conocimiento

Contenido de la página web almacenada por MongoDB

Triples almacenados por MongoDB

interfaz de fondo neo4j
