scrapy scrapingbee Download - scrapy scrapingbee Code source Télécharger

scrapy scrapingbee

Autre code source

1.0.0

Télécharger

Scrapy Stracingbee Middleware

Intégrez le scrapy avec API SctringBee pour utiliser des navigateurs sans tête pour la rotation JavaScript et proxy. Nécessite de créer un compte sur SctringBee.com pour obtenir une clé API.

Installation

pip install scrapy-scrapingbee

Configuration

Ajoutez votre SCRAPINGBEE_API_KEY et le ScrapingBeeMiddleware à votre projet Settings.py. N'oubliez pas de définir CONCURRENT_REQUESTS en fonction de votre plan SctringBee.

 SCRAPINGBEE_API_KEY = 'REPLACE-WITH-YOUR-API-KEY'

DOWNLOADER_MIDDLEWARES = {
    'scrapy_scrapingbee.ScrapingBeeMiddleware' : 725 ,
}

CONCURRENT_REQUESTS = 1

Usage

Héritez de vos araignées de ScrapingBeeSpider et donnez une ScrapingBeeRequest .

SctringBeospider remplace le journal par défaut pour masquer votre clé API dans les journaux de scrapie.

Vous trouverez ci-dessous un exemple de The Spider dans httpbin.py.

 from scrapy_scrapingbee import ScrapingBeeSpider , ScrapingBeeRequest

JS_SNIPPET = 'window.scrollTo(0, document.body.scrollHeight);'


class HttpbinSpider ( ScrapingBeeSpider ):
    name = 'httpbin'
    start_urls = [
        'https://httpbin.org' ,
    ]

    def start_requests ( self ):
        for url in self . start_urls :
            yield ScrapingBeeRequest ( url , params = {
                # 'render_js': False,
                # 'block_ads': True,
                # 'block_resources': False,
                # 'js_snippet': JS_SNIPPET,
                # 'premium_proxy': True,
                # 'country_code': 'fr',
                # 'return_page_source': True,
                # 'wait': 3000,
                # 'wait_for': '#swagger-ui',
            },
            headers = {
                # 'Accept-Language': 'En-US',
            },
            cookies = {
                # 'name_1': 'value_1',
            })

    def parse ( self , response ):
        ...

Vous pouvez passer des paramètres de gratte-basse dans l'argument des params d'un gratte-bbeerequest. Les en-têtes et les cookies sont passés comme une demande de scroty normale. Stracingbeerequest Formats tous les paramètres, en-têtes et cookies au format attendu par l'API SctringBee.

Exemples

Ajoutez votre touche API à Settings.py.

Pour exécuter les exemples, vous avez besoin pour cloner ce référentiel. Dans votre terminal, allez à examples/httpbin/httpbin et exécutez l'exemple d'araignée avec:

scrapy crawl httpbin

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-02-22
taille 12.22KB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0

Actualités connexes Tout