mpspider
1.0.0
公式アカウントの歴史的な記事をクロールし、それらをマークダウンファイルに解析し、GitBookプロジェクトを生成し、最終的にKindle Booksを生成します。
PS :
book.jsonを構成する必要があります2つのクロール方法をサポートしています。
PS :要約記事は、記事「The Road to Architects」などの公開アカウントの記事ページを参照してください。
手順1〜6は完全に自動で、7はあなた自身の状況に依存します
npm i mpspider -g # 第一种方式
mpspider article https://mp.weixin.qq.com/s/CIPosICgva9haqstMDIHag -d dest_path
# 第二种方式,需要手动配置代理,点击公众号「查看历史文章」,详见下面介绍,支持手机微信和 pc 微信列表
mpspider proxy -d dest_path -p proxy_port rawう後、gitbookプロジェクトがdest_pathで作成されます
コマンドを実行します
# 进入抓取后gitbook的地址
cd dest_path
# 创建readme.md,gitbook不创建会报错
touch README.md
# 有必要可以创建book.json,参考gitbook文档
gitbook serve
# 访问地址查看效果
# -------
# 生成电子书
gitbook mobi ./ name.mobi
リファレンス:http://anyproxy.io/cn/#%E8%af%81%E4%B9%A6%E9%85%8D%E7%BD%AE
anyproxy --rule lib/anyproxyRule.jsmpspider.config.jsを使用しますサポートされている構成項目:
Array.sort書き込み方法であり、 mid 、 title 、 content 、 release 、 uriなどのオプションを備えたitemオブジェクトに渡されます。リリースはPINYINファイル名であり、デフォルトのソートはリリースに基づいています。filter :記事のコンテンツフィルター関数は、 items.filter(option.filter)を介して記事リスト配列itemsをフィルターします。アイテムのコンテンツには、 mid 、 title 、 contentが含まれますlistFilter :リスト記事フィルタリング、プロキシモードでのみ使用、記事リストのJSONオブジェクトに従ってフィルターデータ、一般的に使用されるオブジェクトフィールドはauthor 、 title 、 copyright_stat 、 content_url 、 source_url 、 digest 、 content 、 cover 、 is_multiなど。datetime Publish Timestampturndown :4つのオプションをサポートします:それぞれターンダウンの4つの構成項目に対応するプラグkeep 、 remove 、 rule 、およびpluginsafterConverter :HTMLをマークダウンコンテンツに変換した後のターンダウン、 content列を関数に渡します。処理後、処理された文字列return例:
const turndownPluginGfm = require ( 'turndown-plugin-gfm' ) ;
module . exports = {
filter : item => {
if ( item . title . indexOf ( '广告' ) !== - 1 ) {
return false ;
}
return true ;
} ,
turndown : {
keep : 'span' ,
remove : 'span' ,
rule : {
strikethrough : {
filter : [ 'del' , 's' , 'strike' ] ,
replacement : function ( content ) {
return '~' + content + '~' ;
}
}
} ,
plugins : [ turndownPluginGfm . gfm , turndownPluginGfm . tables ]
} ,
afterConverter : content => {
return content . replace ( / <(.+?)> / g , ( i , m ) => {
return `< ${ m } >` ;
} ) ;
}
} ; gitクローンソースコードの後、フォルダーを入力してnpm i
commander 、およびコマンド処理のためのorasummary.mdを生成して、内側リンクのコンテンツを置き換えますbrew install caskroom/cask/calibrenpm i gitbook-cli -g 


