mpspider
1.0.0
قم بالزحف للمقالات التاريخية للحساب الرسمي ، وحوضها في ملفات Markdown ، وإنشاء مشاريع Gitbook ، وأخيراً إنشاء كتب Kindle.
ملاحظة :
book.json يدعم طريقتين للزحف:
ملاحظة : تشير المقالة الملخص إلى صفحة المقالة الخاصة بحساب عام ، مثل مقالة "الطريق إلى المهندسين المعماريين"
الخطوات 1 ~ 6 تلقائية بالكامل ، 7 تعتمد على موقفك الخاص
npm i mpspider -g # 第一种方式
mpspider article https://mp.weixin.qq.com/s/CIPosICgva9haqstMDIHag -d dest_path
# 第二种方式,需要手动配置代理,点击公众号「查看历史文章」,详见下面介绍,支持手机微信和 pc 微信列表
mpspider proxy -d dest_path -p proxy_port بعد الزحف ، سيتم إنشاء مشروع Gitbook في dest_path
تنفيذ الأمر
# 进入抓取后gitbook的地址
cd dest_path
# 创建readme.md,gitbook不创建会报错
touch README.md
# 有必要可以创建book.json,参考gitbook文档
gitbook serve
# 访问地址查看效果
# -------
# 生成电子书
gitbook mobi ./ name.mobi
المرجع: http://anyproxy.io/cn/#٪E8٪81٪E4٪B9٪A6٪E9٪85٪8D٪E7٪BD٪AE
anyproxy --rule lib/anyproxyRule.jsmpspider.config.jsعناصر التكوين المدعومة:
Array.sort . يتم تمريرها إلى كائن item ، مع خيارات مثل mid ، title ، content ، release ، uri ، إلخ .filter : وظيفة مرشح محتوى المقالة ، تقوم بتصفية items صفيف قائمة المقالة من خلال items.filter(option.filter) . يتضمن محتوى العنصر: mid ، title ، contentlistFilter : قائمة تصفية المقالة ، المستخدمة فقط في وضع الوكيل ، بيانات التصفية وفقًا لكائن JSON في قائمة المقالات ، حقول الكائنات الشائعة الاستخدام هيauthor ، title ، copyright_stat ، content_url ، source_url ، digest ، content ، cover ، is_multi ، إلخ.datetime Publish Timestampturndown : يدعم أربعة خيارات: keep ، remove ، rule ، plugins ، المقابلة لعناصر التكوين الأربعة من التداول على التواليafterConverter : الانقسام بعد تحويل HTML إلى محتوى تخفيض ، تمرير سلسلة content إلى الوظيفة. بعد المعالجة ، return السلسلة المصنعةمثال:
const turndownPluginGfm = require ( 'turndown-plugin-gfm' ) ;
module . exports = {
filter : item => {
if ( item . title . indexOf ( '广告' ) !== - 1 ) {
return false ;
}
return true ;
} ,
turndown : {
keep : 'span' ,
remove : 'span' ,
rule : {
strikethrough : {
filter : [ 'del' , 's' , 'strike' ] ,
replacement : function ( content ) {
return '~' + content + '~' ;
}
}
} ,
plugins : [ turndownPluginGfm . gfm , turndownPluginGfm . tables ]
} ,
afterConverter : content => {
return content . replace ( / <(.+?)> / g , ( i , m ) => {
return `< ${ m } >` ;
} ) ;
}
} ; بعد رمز مصدر استنساخ GIT ، أدخل المجلد وقم بتنفيذ npm i
commander ora لمعالجة الأوامرsummary.md لاستبدال محتوى الرابط الداخلي brew install caskroom/cask/calibrenpm i gitbook-cli -g 


