Faça o download do romance no site https://www.po18.tw como um documento TXT.
Este site não pode ser acessado na China continental e um proxy deve ser usado.
Obtenha apenas conteúdo gratuito/comprado do capítulo. Por favor, compre o capítulo pago manualmente primeiro.
Ambiente de Desenvolvimento: Python 3.7
reference.py a demonstração do romance PO18 (Python 2.7).
Belo grupo
Solicitações
lxml
Primeiro encontre o ID do livro (a sequência de números após o URL /books/ ) e atribua -o ao book_number .
Encontre o número total de conteúdo do capítulo (consulte os [quatro dígitos] no capítulo anterior no capítulo mais recente do diretório, ou veja do狀態未完結(目前xxx章回) ) e atribui -o ao chapter_sum .
Você só pode acessar a página do romance após o login e atribuir account e pwd no login() como informações da sua conta real (essas informações existem localmente e serão enviadas apenas ao servidor PO18 para login).
Alterar txt = open('路径' + book_number + '.txt', 'a') , encontre um caminho de pasta e substitua os caracteres chineses.
login() -> data{} 's client_ip é substituído por seu próprio IP nativo (como verificar o IP, não me pergunte). Se você usar esse script com moderação, o servidor do site não responderá aos IPs que são acessados com muita frequência.
Se o site relatar um erro, encontre a última linha de comando em saída xx https://www.po18.tw/books/---/articles/----- processing... , atribua o número xx para start .
Aqui você geralmente precisa modificar os parâmetros page no getContent(page) e calcule você mesmo.
Reencontrar e o download continuará. (Esta postagem pode ser repetida várias vezes)