scrappy_asp.net
Classificando algumas dificuldades ao descartar sites de eliminação de ASP.NET
Este é um exemplo de uso do Scrappy no site ASP.NET.
Estou compartilhando esse porque, embora pareça trivial, tive alguns problemas tentando fazer isso.
- O site descartado não fornece links para alterar a página, portanto, você deve configurar a carga útil para fazer uma solicitação de formulário.
- Você encontrará esses parâmetros no Payload.py. Há uma carga útil para enviar de primeiro formulário e carregar a tabela, a próxima é para alterar as páginas quando a página selecionada está fora dos limites.
- Na pasta Spiders, existe Spider_1.py que foi apto a fazer o trabalho usando o selênio, mas acho que não é uma boa ideia. Procure Spider_2.py para a solução que encontrei usando apenas a navegação.