mpspider
1.0.0
Ползуйте исторические статьи официальной учетной записи, разрабатывайте их в файлы разметки, генерируют проекты Gitbook и, наконец, генерируют книги Kindle.
PS :
book.json Поддерживает два метода ползания:
PS : Сводная статья относится к странице статьи общедоступного аккаунта, такой как статья «Дорога к архитекторам»
Шаги 1 ~ 6 полностью автоматические, 7 зависит от вашей собственной ситуации
npm i mpspider -g # 第一种方式
mpspider article https://mp.weixin.qq.com/s/CIPosICgva9haqstMDIHag -d dest_path
# 第二种方式,需要手动配置代理,点击公众号「查看历史文章」,详见下面介绍,支持手机微信和 pc 微信列表
mpspider proxy -d dest_path -p proxy_port После ползания в dest_path будет создан проект Gitbook
Выполнить команду
# 进入抓取后gitbook的地址
cd dest_path
# 创建readme.md,gitbook不创建会报错
touch README.md
# 有必要可以创建book.json,参考gitbook文档
gitbook serve
# 访问地址查看效果
# -------
# 生成电子书
gitbook mobi ./ name.mobi
Ссылка: http://anyproxy.io/cn/#%E8%F%81%E4%B9%A6%E9%85%8D%E7%BD%AE
anyproxy --rule lib/anyproxyRule.jsmpspider.config.jsПоддерживаемые элементы конфигурации:
Array.sort , и она передается в объект item , с такими параметрами, как mid , title , content , release , uri и т. Д. Выпуск - это имя файла Pinyin, а сортировка по умолчанию основана на выпуске.filter : функция фильтра содержимого статьи, фильтруют items массива списков статьи через items.filter(option.filter) . Содержание элемента включает в себя: mid , title , contentlistFilter : Список фильтрации статьи, используемая только в режиме прокси, данные фильтра в соответствии с объектом JSON Списка статьи, обще используемые поля объектов являютсяauthor , title , copyright_stat , content_url , source_url , digest , content , cover , is_multi и т. Д.datetime publicturndown : поддерживает четыре варианта: keep , remove , rule и plugins , соответствующие четырем элементам конфигурации, соответственно, соответственноafterConverter : переключение после преобразования HTML в содержимое разметки, передайте строку content в функцию. После обработки return обработанную строкуПример:
const turndownPluginGfm = require ( 'turndown-plugin-gfm' ) ;
module . exports = {
filter : item => {
if ( item . title . indexOf ( '广告' ) !== - 1 ) {
return false ;
}
return true ;
} ,
turndown : {
keep : 'span' ,
remove : 'span' ,
rule : {
strikethrough : {
filter : [ 'del' , 's' , 'strike' ] ,
replacement : function ( content ) {
return '~' + content + '~' ;
}
}
} ,
plugins : [ turndownPluginGfm . gfm , turndownPluginGfm . tables ]
} ,
afterConverter : content => {
return content . replace ( / <(.+?)> / g , ( i , m ) => {
return `< ${ m } >` ;
} ) ;
}
} ; После исходного кода GIT Clone введите папку и выполните npm i
commander и ora для обработки командыsummary.md чтобы заменить содержимое внутренней ссылки brew install caskroom/cask/calibrenpm i gitbook-cli -g 


