soul manga
1.0.0
使用reactjs + python/flask + sqlite + scrapy 構建的單頁應用漫畫站,裡面還用到了gunicorn和fabric的python管理部署工具,當時自己構建自動部署的時候用的



前置條件node.js , python3
npm install
pip install -r requirements.txt
cd server python web_server.py
npm start
訪問localhost:3000 over .....
soul_manga_spider.py定義了三種抓取方式, REQ_TYPE分別對應不同的url類型:單個漫畫,單個頁面的所有漫畫,以及全部漫畫。還有一個is_update參數用於表明是否只抓取最近更新的頁面url然後做增量更新。之前自己部署的時候基本上配合crontab 12小時抓取一次足夠了,默認情況is_update是false,且REQ_TYPE是default表示什麼都不做,默認使用我已經抓取的db。日誌級別根據自己需要調整setting.py的LOG_LEVEL和LOG_FILE