mpspider
1.0.0
공식 계정의 역사적 기사를 기어 다니고, 마크 다운 파일로 구문 분석하고, Gitbook 프로젝트를 생성하고, 마지막으로 Kindle Books를 생성하십시오.
추신 :
book.json 구성해야합니다 두 가지 크롤링 방법을 지원합니다.
추신 : 요약 기사는 "건축가로가는 길"기사와 같은 공개 계정의 기사 페이지를 나타냅니다.
1 ~ 6 단계는 완전히 자동이며 7은 자신의 상황에 따라 다릅니다.
npm i mpspider -g # 第一种方式
mpspider article https://mp.weixin.qq.com/s/CIPosICgva9haqstMDIHag -d dest_path
# 第二种方式,需要手动配置代理,点击公众号「查看历史文章」,详见下面介绍,支持手机微信和 pc 微信列表
mpspider proxy -d dest_path -p proxy_port 크롤링 후 gitbook 프로젝트가 dest_path 에서 만들어집니다.
명령을 실행하십시오
# 进入抓取后gitbook的地址
cd dest_path
# 创建readme.md,gitbook不创建会报错
touch README.md
# 有必要可以创建book.json,参考gitbook文档
gitbook serve
# 访问地址查看效果
# -------
# 生成电子书
gitbook mobi ./ name.mobi
참조 : http://anyproxy.io/cn/#%E8%81%E4%B9%A6%E9%85%8D%E7%BD%AE
anyproxy --rule lib/anyproxyRule.jsmpspider.config.js 를 사용하십시오지원되는 구성 항목 :
Array.sort 과 동일하며 mid , title , content , release , uri 등과 같은 옵션이있는 item 객체로 전달됩니다. 릴리스 릴리스는 Pinyin 파일 이름 이며 기본 정렬은 릴리스를 기반으로합니다.filter : 기사 내용 필터 기능은 항목을 통해 기사 목록 배열 items 필터 items.filter(option.filter) 를 필터링합니다. 항목 내용에는 다음이 포함됩니다. mid , title , contentlistFilter : List 기사 필터링, 프록시 모드에서만 사용되는 필터, 필터 데이터는 기사 목록의 JSON 개체에 따라 일반적으로 사용되는 객체 필드는 다음과 같습니다.author , title , copyright_stat , content_url , source_url , digest , content , cover , is_multi 등datetime 게시 timestamp를 게시합니다turndown : 네 가지 옵션을 지원합니다 : 각각 4 개의 구성 항목에 해당하는 keep , remove , rule 및 plugins 각각 턴 다운 다운 다운입니다.afterConverter : HTML을 Markdown 컨텐츠로 변환 한 후 content 문자열을 함수로 전달하십시오. 처리 후 처리 된 문자열을 return예:
const turndownPluginGfm = require ( 'turndown-plugin-gfm' ) ;
module . exports = {
filter : item => {
if ( item . title . indexOf ( '广告' ) !== - 1 ) {
return false ;
}
return true ;
} ,
turndown : {
keep : 'span' ,
remove : 'span' ,
rule : {
strikethrough : {
filter : [ 'del' , 's' , 'strike' ] ,
replacement : function ( content ) {
return '~' + content + '~' ;
}
}
} ,
plugins : [ turndownPluginGfm . gfm , turndownPluginGfm . tables ]
} ,
afterConverter : content => {
return content . replace ( / <(.+?)> / g , ( i , m ) => {
return `< ${ m } >` ;
} ) ;
}
} ; Git Clone 소스 코드 후 폴더를 입력하고 npm i 실행합니다.
commander 및 orasummary.md 생성합니다. brew install caskroom/cask/calibrenpm i gitbook-cli -g 


