Ini adalah perpustakaan untuk mengambil dan mengunduh gambar dari gambar Google.
Ini menggunakan kueri input dan argumen untuk mencari dan memadamkan objek gambar. Gambar -gambar ini dapat dilindungi di bawah hak cipta, dan Anda tidak boleh melakukan apa pun yang dapat dihukum dengan mereka, seperti menggunakannya untuk penggunaan komersial. Perpustakaan ini terinspirasi oleh google-images-download oleh Hardikvasa , tetapi menambahkan beberapa peningkatan kualitas hidup, seperti dapat mengambil URL juga. Perpustakaan ini tidak akan mungkin, bagaimanapun, tanpa pekerjaan mereka, dan orang -orang yang bekerja untuk melanjutkannya.
Ada satu argumen yang diperlukan dan dua argumen di kedua fungsi utama:
| Argumen | Tipe | Keterangan |
|---|---|---|
| pertanyaan: | str, list | Baik string atau daftar yang berisi kata kunci untuk dicari. Jika kueri adalah string, itu akan dipisahkan menjadi kata kunci yang berbeda berdasarkan spasi. |
| membatasi | int | Jumlah gambar yang harus dicari. Tidak bisa lebih besar dari 100. *default ke 1 * |
| Argumen: | dikt | Ini adalah kamus yang berisi banyak nilai opsional, yang semuanya akan tercantum di sini. Mereka dibagi menjadi dua kategori: argumen pencarian dan argumen unduh |
| Argumen | Tipe | Keterangan |
|---|---|---|
| download_format | str | Menentukan ekstensi file untuk mengunduh semua gambar sebagai. Harus ekstensi file gambar yang valid yang diakui oleh PIL . *Catatan: Ini membutuhkan waktu lebih lama dengan sejumlah besar gambar* |
| direktori | str | Ini menentukan nama direktori untuk mengunduh gambar. Ini secara otomatis akan dibuat di direktori fungsi dipanggil, kecuali jika direktori sudah ada atau jalur ditentukan. |
| jalur | str | Ini menentukan jalur untuk membuat direktori unduhan di. |
| Batas waktu | Int float | Ini menentukan waktu maksimum program akan menunggu untuk mengambil satu gambar dalam detik. |
| verbose | bool | Setel ke True untuk mencetak pembaruan tentang kemajuan ke konsol. |
| Argumen | Nilai yang diterima | Keterangan |
|---|---|---|
| warna | 'merah', 'oranye', 'kuning', 'hijau', 'teal', 'biru', 'ungu', 'pink', 'putih', 'abu -abu', 'hitam', 'coklat' | Filter gambar berdasarkan warna dominan. |
| color_type | 'penuh', 'grayscale', 'transparan' | Filter gambar berdasarkan jenis warna, warna penuh, skala abu -abu, atau transparan. |
| lisensi | 'Creative_Commons', 'Other_licenses' | Filter gambar berdasarkan lisensi penggunaan. |
| jenis | 'Face', 'Photo', 'Clipart', 'Lineart', 'Gif' | Filter berdasarkan jenis gambar yang harus dicari. * Jangan bingung dengan search_format * |
| waktu | 'past_day', 'past_week', 'past_month', 'past_year' | Hanya menemukan gambar yang diposting dalam waktu yang ditentukan. |
| aspek_ratio | 'tinggi', 'persegi', 'lebar', 'panoramik' | Menentukan rasio aspek gambar. |
| search_format | 'jpg', 'gif', 'png', 'bmp', 'svg', 'webp', 'ico', 'mentah' | Menyaring gambar yang bukan format tertentu. Jika Anda ingin mengunduh gambar sebagai format tertentu, gunakan argumen 'download_format' sebagai gantinya. |
Ada empat fungsi yang tersedia, unduh , URL , Image_Objects dan download_image , yang berfungsi berbeda dari yang lain:
import GoogleImageScraper
images = GoogleImageScraper ( query , limit , arguments )Ini akan mengunduh gambar berdasarkan argumen. Nilai yang dikembalikan akan mengikuti format ini:
{ 'images' : [ images ], 'errors' : Number of Errors }Masing -masing gambar dalam daftar gambar akan mengikuti format tertentu juga:
{ 'path' : Image Path , 'url' : Image Url } import GoogleImageScraper
urls = GoogleImageScraper . urls ( query , limit , arguments )Fungsi ini hanya mengembalikan daftar URL gambar dari istilah pencarian.
Fungsi ini sedikit lebih niche, tetapi mungkin berguna bagi sebagian orang. Alih -alih mengembalikan daftar URL gambar seperti dengan fungsi URLS , ia mengembalikan daftar objek gambar yang berisi data yang berguna, terstruktur seperti itu:
{ 'url' : Image url , 'thumbnail' : Url of image thumbnail , 'source_url' : The webpage the image was found on , 'source' : The base url of the source }Penggunaannya mirip dengan fungsi sebelumnya:
import GoogleImageScraper
image_objects = GoogleImageScraper . image_objects ( query , limit , arguments )Gunakan fungsi ini untuk mengunduh gambar melalui URL. Fungsi ini berbeda dari yang lain karena dibutuhkan argumen input yang berbeda, disediakan di bawah ini:
| Argumen | Tipe | Keterangan |
|---|---|---|
| url | str | URL untuk mengunduh gambar dari. *diperlukan* |
| nama | str | Nama file. Jangan sertakan ekstensi file. *diperlukan* |
| jalur | str | Jalur untuk mengunduh gambar ke. |
| download_format | str | Format untuk mengunduh gambar. Butuh beberapa saat lebih lama |
| timpa | bool | Apakah akan menimpa file dengan nama yang sama. Default ke True . Memelihara FileExistsError jika False dan file ada. |
Ada kemungkinan Anda tidak dapat mencapai jumlah gambar yang ditentukan dalam argumen batas . Ini terjadi ketika ada kesalahan mengunduh gambar, apakah itu tidak dalam format gambar, atau waktu permintaan keluar, itu bisa terjadi. Saat mengunduh sejumlah besar gambar, ini dapat menyebabkan batas Anda tidak tercapai. Item 'Kesalahan' dalam kamus yang dikembalikan dari unduhan adalah cara Anda melacaknya. Misalnya, jika batas Anda adalah 100, dan 3 gambar melempar kesalahan, Anda akan mendapatkan 97 gambar kembali, dan item 'kesalahan' akan menjadi 3. Sekarang, jika batas Anda 20, dan 3 gambar melemparkan kesalahan , Anda masih akan mendapatkan 20 item kembali, dan item 'kesalahan' akan meningkat.
| Kesalahan | Keterangan |
|---|---|
LimitError | Dinaikkan ketika argumen batas di atas 100 atau tidak jenis yang tepat. |
ArgumentError | Dinaikkan ketika nilai tidak valid diberikan untuk argumen |
QueryError | Dibesarkan jika tidak ada pertanyaan atau kueri bukanlah tipe yang tepat |
UnpackError | Dibesarkan jika tidak ada gambar yang ditemukan di halaman. |
DownloadError | Eksklusif untuk fungsi download_image . Dibesarkan jika gambar gagal diunduh. |
Sertakan ini seperti itu:
from GoogleImageScraper . errors import < error >Beberapa contoh nyata tercantum di sini:
import GoogleImageScraper
urls = GoogleImageScraper . urls ( query = 'cats' , limit = 10 , arguments = { 'color' : 'black' })Hasil:
[ 'https://www.rd.com/wp-content/uploads/2021/01/GettyImages-1175550351.jpg' ,
'https://www.history.com/.image/ar_4:3%2Cc_fill%2Ccs_srgb%2Cfl_progressive%2Cq_auto:good%2Cw_1200/MTg0NTEzNzgyNTMyNDE2OTk5/black-cat-gettyimages-901574784.jpg' ,
'https://www.thesprucepets.com/thmb/kF3_dQW_JT1ClMQDlISxq3BgeT4=/6843x5132/smart/filters:no_upscale()/facts-about-black-cats-554102-hero-7281a22d75584d448290c359780c2ead.jpg' ,
'https://i.guim.co.uk/img/media/c5e73ed8e8325d7e79babf8f1ebbd9adc0d95409/2_5_1754_1053/master/1754.jpg?width=465&quality=45&auto=format&fit=max&dpr=2&s=065f279099ded1062688e357b155dc29' ,
'https://cdn.cnn.com/cnnnext/dam/assets/141030105303-kiki-irpt.jpg' ,
'https://imagesvc.meredithcorp.io/v3/mm/image?url=https%3A%2F%2Fstatic.onecms.io%2Fwp-content%2Fuploads%2Fsites%2F34%2F2021%2F09%2F27%2Fblack-cat-kitchen-rug-getty-0921-2000.jpg' ,
'https://www.gannett-cdn.com/presto/2021/10/28/USAT/1bf79c6a-5d88-4e64-b398-c40418a79829-XXX_iStock_000017680551Large.jpg' ,
'https://cdn.sanity.io/images/0vv8moc6/dvm360/f28cc9b680aed62edd018ce47a5cbb96c4f78f3b-4860x3024.jpg' ,
'https://vbspca.com/wp-content/uploads/2019/10/Image-e1570199876255.jpeg' ,
'https://ichef.bbci.co.uk/news/976/cpsprodpb/AECE/production/_99805744_gettyimages-625757214.jpg' ] import GoogleImageScraper
images = GoogleImageScraper . download ( query = 'dogs' , limit = 1 , arguments = { 'color' : 'brown' , 'download_format' : 'png' })Hasil:
{ 'images' : [{ 'path' : '<path> \ images \ dogs-0.png' , 'url' : 'https://post.medicalnewstoday.com/wp-content/uploads/sites/3/2020/02/322868_1100-800x825.jpg' }], 'errors' : 0 } import GoogleImageScraper
objects = GoogleImageScraper . image_objects ( query = 'birds' , limit = 1 , arguments = { 'color' : 'yellow' })Hasil:
[{ 'thumbnail' : 'https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcQwDI5y3_n2rwFQLZKrBXs5VL_J38zlZVvdZAooD8F8d7lY8ZA9iLEb1-AoBBWpGftpdoc&usqp=CAU' , 'url' : 'https://www.sfvaudubon.org/wp-content/uploads/2020/03/YEWAcrop.jpg' , 'source_url' : 'https://www.sfvaudubon.org/sfv-backyard-bird-identification/' , 'source' : 'sfvaudubon.org' }, { 'thumbnail' : 'https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcR1k5IhGCAPgU468tyPrgkuY9WC3T83zRxzFrTOOUs0OL_kanPG8VPKXV3euijAlzW9AsE&usqp=CAU' , 'url' : 'https://ca.audubon.org/sites/default/files/styles/article_teaser/public/yellowwarbler_peter_latourrette.jpg?itok=PFRtxcGN' , 'source_url' : 'https://ca.audubon.org/birds-0' , 'source' : 'ca.audubon.org' }]