オープンソースWebナレッジグラフプロジェクト
- Baidu百科事典の中国語のページをクロールします
- トリプルとウェブコンテンツを解析します
- 中国の知識グラフの構築
- 百科事典ボットの構築(建設中)
更新20200720
LMY-NLP0701のおかげで、Windowsでの展開リファレンスWindowsの展開方法、Windowsでの展開方法!
更新20191121
- Crawler Framework Scrapyにコードを移行します
- いくつかのコードの最適化された抽出
- Mongodbへのデータの持続性移行
- チャットボットの失敗の問題を修正します
- NEO4Jバックエンドインターフェイスを開く知識グラフの形成効果を表示する
ヒント
- それがプロジェクトの問題である場合は、問題を尋ねてください。
- 不便な開示が含まれている場合は、メールを送信してください。
- チャットボットリンクにアクセスしてください
- 成形百科事典知識グラフアクセスリンク、ユーザー名:NEO4J、パスワード:123。効果は次のとおりです。

環境
- Python 3.6
- Re:URL通常のマッチ
- スクラピー:ウェブクローラーとウェブ解析
- NEO4J:知識グラフデータベース、インストールのリンクを参照してください
- PIPインストールNeo4J-Driver:Neo4J Pythonドライバー
- PIPインストールPymongodb:MongodbのPythonサポート
- MongoDBデータベース:インストールリファレンスリンク
コード実行:
cd WEB_KG/baike
scrapy crawl baike
実行インターフェイス(Ctrl+Cを押して停止する): 
ナレッジグラフレンダリング

Mongodbが保存したWebページコンテンツ

Mongodbが保管したトリプル

NEO4Jバックグラウンドインターフェイス
