Descargar scrapy scrapingbee - Descargar el código fuente de scrapy scrapingbee

scrapy scrapingbee

Otro código fuente

1.0.0

Descargar

Scrapy scrapepingbee middleware

Integre Scrapy con la API de rasguño para usar navegadores sin cabeza para JavaScript y rotación proxy. Requiere crear una cuenta en scrapingbee.com para obtener una clave API.

Instalación

pip install scrapy-scrapingbee

Configuración

Agregue su SCRAPINGBEE_API_KEY y el ScrapingBeeMiddleware a su proyecto settings.py. No olvide establecer CONCURRENT_REQUESTS de acuerdo con su plan de raspingbee.

 SCRAPINGBEE_API_KEY = 'REPLACE-WITH-YOUR-API-KEY'

DOWNLOADER_MIDDLEWARES = {
    'scrapy_scrapingbee.ScrapingBeeMiddleware' : 725 ,
}

CONCURRENT_REQUESTS = 1

Uso

Heredar a sus arañas de ScrapingBeeSpider y producir un ScrapingBeeRequest .

SrapingBeSpider anula el registrador predeterminado para ocultar su tecla API en los registros de Scrapy.

A continuación puede ver un ejemplo de la araña en httpbin.py.

 from scrapy_scrapingbee import ScrapingBeeSpider , ScrapingBeeRequest

JS_SNIPPET = 'window.scrollTo(0, document.body.scrollHeight);'


class HttpbinSpider ( ScrapingBeeSpider ):
    name = 'httpbin'
    start_urls = [
        'https://httpbin.org' ,
    ]

    def start_requests ( self ):
        for url in self . start_urls :
            yield ScrapingBeeRequest ( url , params = {
                # 'render_js': False,
                # 'block_ads': True,
                # 'block_resources': False,
                # 'js_snippet': JS_SNIPPET,
                # 'premium_proxy': True,
                # 'country_code': 'fr',
                # 'return_page_source': True,
                # 'wait': 3000,
                # 'wait_for': '#swagger-ui',
            },
            headers = {
                # 'Accept-Language': 'En-US',
            },
            cookies = {
                # 'name_1': 'value_1',
            })

    def parse ( self , response ):
        ...

Puede pasar los parámetros de rasguño en el argumento de parámetros de un scrapingbeequest. Los encabezados y las cookies se pasan como una solicitud de franquear normal. SCROPINGBEEREQUEST FORMATOS Todos los parámetros, encabezados y cookies al formato esperado por la API de rasguño.

Ejemplos

Agregue su clave API a Settings.py.

Para ejecutar los ejemplos que necesita para clonar este repositorio. En su terminal, vaya a examples/httpbin/httpbin y ejecute la araña de ejemplo con:

scrapy crawl httpbin

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-02-22
tamaño 12.22KB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Otro código fuente

1.0.0
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Otro código fuente

1.0.0

Información relacionada Todo