scrapy scrapingbee Download - scrapy scrapingbee Source Code Download

scrapy scrapingbee

Kode sumber lainnya

1.0.0

Unduh

Scrapy ScrapingBee Middleware

Integrasi gesekan dengan API ScrapingBee untuk menggunakan browser tanpa kepala untuk rotasi JavaScript dan proxy. Perlu membuat akun di ScrapingBee.com untuk mendapatkan kunci API.

Instalasi

pip install scrapy-scrapingbee

Konfigurasi

Tambahkan SCRAPINGBEE_API_KEY Anda dan ScrapingBeeMiddleware ke pengaturan proyek Anda.py. Jangan lupa untuk mengatur CONCURRENT_REQUESTS sesuai dengan rencana scrapingbee Anda.

 SCRAPINGBEE_API_KEY = 'REPLACE-WITH-YOUR-API-KEY'

DOWNLOADER_MIDDLEWARES = {
    'scrapy_scrapingbee.ScrapingBeeMiddleware' : 725 ,
}

CONCURRENT_REQUESTS = 1

Penggunaan

Mewarisi laba -laba Anda dari ScrapingBeeSpider dan menghasilkan ScrapingBeeRequest .

Scrapingbeespider mengesampingkan logger default untuk menyembunyikan kunci API Anda di log gesek.

Di bawah ini Anda dapat melihat contoh dari laba -laba di httpbin.py.

 from scrapy_scrapingbee import ScrapingBeeSpider , ScrapingBeeRequest

JS_SNIPPET = 'window.scrollTo(0, document.body.scrollHeight);'


class HttpbinSpider ( ScrapingBeeSpider ):
    name = 'httpbin'
    start_urls = [
        'https://httpbin.org' ,
    ]

    def start_requests ( self ):
        for url in self . start_urls :
            yield ScrapingBeeRequest ( url , params = {
                # 'render_js': False,
                # 'block_ads': True,
                # 'block_resources': False,
                # 'js_snippet': JS_SNIPPET,
                # 'premium_proxy': True,
                # 'country_code': 'fr',
                # 'return_page_source': True,
                # 'wait': 3000,
                # 'wait_for': '#swagger-ui',
            },
            headers = {
                # 'Accept-Language': 'En-US',
            },
            cookies = {
                # 'name_1': 'value_1',
            })

    def parse ( self , response ):
        ...

Anda dapat melewati parameter scrapingbee dalam argumen params dari scrapingbeerequest. Header dan cookie disahkan seperti permintaan scapy normal. ScrapingBeerequest memformat semua parameter, header, dan cookie untuk format yang diharapkan oleh API ScrapingBee.

Contoh

Tambahkan tombol API Anda ke settings.py.

Untuk menjalankan contoh yang Anda butuhkan untuk mengkloning repositori ini. Di terminal Anda, buka examples/httpbin/httpbin dan jalankan contoh laba -laba dengan:

scrapy crawl httpbin

Memperluas

Informasi Tambahan

Versi 1.0.0
Tipe Kode sumber lainnya
Waktu Pembaruan 2025-02-22
ukuran 12.22KB
Berasal dari Github

Aplikasi Terkait

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

Direkomendasikan untuk Anda

chat.petals.dev

Kode sumber lainnya

1.0.0
GPT Prompt Templates

Kode sumber lainnya

1.0.0
GPTyped

Kode sumber lainnya

GPTyped 1.0.5
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0
Google Dorks

Kode sumber lainnya

1.0
shepherd

Kode sumber lainnya

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Kode sumber lainnya

1.0.0

Informasi Terkait Semua