Proyek Grafik Pengetahuan Web Open Source
- Merangkak halaman Cina Baidu Encyclopedia
- Penguraian tiga kali lipat dan konten web
- Membangun Grafik Pengetahuan Cina
- Membangun bot ensiklopedia (sedang dibangun)
Perbarui 20200720
Referensi Penerapan di Windows Cara Menyebarkan di Windows, Berkat LMY-NLP0701!
UPDATE 20191121
- Migrasi kode ke kerangka crawler gesekan
- Ekstraksi yang dioptimalkan dari beberapa kode
- Migrasi Kegigihan Data ke MongoDB
- Perbaiki masalah kegagalan chatbot
- Buka antarmuka backend neo4j untuk melihat efek pembentukan grafik pengetahuan
Tips
- Jika ini masalah proyek, silakan tanyakan masalah.
- Jika melibatkan pengungkapan yang tidak nyaman, silakan kirim email.
- Chatbot silakan kunjungi tautannya
- Tautan Akses Grafik Pengetahuan Encyclopedia Cetakan, Nama Pengguna: Neo4j, Kata Sandi: 123. Efeknya adalah sebagai berikut:

lingkungan
- Python 3.6
- Re: pertandingan reguler URL
- Scrapy: Web Crawler dan Web Parsing
- Neo4j: Database Grafik Pengetahuan, silakan merujuk ke tautan untuk instalasi
- Pip Instal Neo4j-Driver: Neo4j Python Driver
- Pip Instal PymongoDB: Dukungan Python untuk MongoDB
- MongoDB Database: Tautan Referensi Instalasi
Eksekusi Kode:
cd WEB_KG/baike
scrapy crawl baike
Antarmuka eksekusi (tekan Ctrl+C untuk berhenti): 
Rendering grafik pengetahuan

Konten halaman web disimpan oleh MongoDB

Triples disimpan oleh MongoDB

antarmuka latar belakang neo4j
