Dies ist eine Bibliothek zum Abrufen und Herunterladen von Bildern aus Google Images.
Es verwendet eine Eingabeabfrage und Argumente, um Bildobjekte zu durchsuchen und zurückzuziehen. Diese Bilder können im Urheberrecht geschützt werden, und Sie sollten nichts mit ihnen bestraft werden, z. B. für den kommerziellen Gebrauch. Diese Bibliothek ist von google-images-download von Hardikvasa inspiriert, fügt jedoch einige Verbesserungen der Lebensqualität hinzu, z. B. auch, um URLs abzurufen. Diese Bibliothek wäre jedoch ohne ihre Arbeit und die Menschen, die daran arbeiten, sie fortzusetzen, nicht möglich.
In beiden Hauptfunktionen gibt es ein erforderliches Argument und zwei Argumente:
| Argument | Typen | Beschreibung |
|---|---|---|
| Abfrage: | STR, Liste | Entweder eine Zeichenfolge oder eine Liste, die die zu gesuchten Schlüsselwörter enthält. Wenn die Abfrage eine Zeichenfolge ist, wird sie nach Leerzeichen in verschiedene Schlüsselwörter unterteilt. |
| Limit | int | Die Anzahl der Bilder, nach denen zu suchen ist. Kann nicht größer sein als 100. *Standards auf 1 * |
| Argumente: | DICT | Dies ist ein Wörterbuch, das viele optionale Werte enthält, die hier alle aufgeführt sind. Sie sind in zwei Kategorien unterteilt: Suchargumente und Herunterladen von Argumenten |
| Argument | Typen | Beschreibung |
|---|---|---|
| Download_Format | str | Gibt eine Dateierweiterung an, um alle Bilder als herunterzuladen. Muss eine von PIL erkannte gültige Erweiterung der Bilddatei sein. *Hinweis: Dies dauert mit großen Bildern erheblich länger* |
| Verzeichnis | str | Dies gibt den Verzeichnisnamen an, um die Bilder herunterzuladen. Dies wird automatisch im Verzeichnis erstellt, in dem die Funktion aufgerufen wird, sofern das Verzeichnis nicht bereits vorhanden oder Pfad angegeben ist. |
| Weg | str | Dies gibt den Pfad an, das Download -Verzeichnis in zu erstellen. |
| Time-out | int float | Dies gibt die maximale Zeit an, die das Programm wartet, um ein einzelnes Bild in Sekunden abzurufen. |
| ausführlich | bool | Setzen Sie auf True , um Aktualisierungen zum Fortschritt der Konsole zu drucken. |
| Argument | Akzeptierte Werte | Beschreibung |
|---|---|---|
| Farbe | "Rot", "Orange", "Gelb", "grün", "blaugrün", "blau", "lila", "pink", "weiß", "grau", "schwarz", "braun" | Filterbilder durch die dominante Farbe. |
| color_type | "Voll", "Graustufen", "transparent" | Filterbilder nach Farbtyp, Vollfarbe, Graustufen oder transparent. |
| Lizenz | 'Creative_Commons', 'other_licenses' | Filterbilder nach der Nutzungslizenz. |
| Typ | "Gesicht", "Foto", "Clipart", "lineart", "Gif" | Filter nach der Art der Bilder, nach denen Sie suchen sollten. * Nicht zu verwechseln mit Search_Format * |
| Zeit | 'past_day', 'past_week', 'past_month', 'past_year' ' | Findet nur Bilder, die in der angegebenen Zeit veröffentlicht wurden. |
| Aspekt_ratio | "groß", "quadratisch", "breit", "Panoramic" | Gibt das Seitenverhältnis der Bilder an. |
| Search_Format | 'JPG', 'GIF', 'Png', 'Bmp', 'Svg', 'Webp', 'ICO', 'RAW' | Filtert Bilder, die kein angegebenes Format sind. Wenn Sie Bilder als bestimmtes Format herunterladen möchten, verwenden Sie stattdessen das Argument "Download_Format". |
Es gibt vier verfügbare Funktionen: Download , URLs , Image_Objects und Download_image , die anders funktionieren als die anderen:
import GoogleImageScraper
images = GoogleImageScraper ( query , limit , arguments )Dadurch wird Bilder basierend auf den Argumenten heruntergeladen. Die zurückgegebenen Werte folgen diesem Format:
{ 'images' : [ images ], 'errors' : Number of Errors }Jedes der Bilder in der Liste der Bilder folgt ebenfalls einem bestimmten Format:
{ 'path' : Image Path , 'url' : Image Url } import GoogleImageScraper
urls = GoogleImageScraper . urls ( query , limit , arguments )Diese Funktion gibt einfach eine Liste von Bild -URLs aus den Suchbegriffen zurück.
Diese Funktion ist etwas mehr Nische, kann aber für manche Menschen nützlich sein. Anstatt eine Liste von Bild -URLs wie bei der URLS -Funktion zurückzugeben, wird eine Liste von Bildobjekten zurückgegeben, die nützliche Daten enthalten, die wie SO strukturiert sind:
{ 'url' : Image url , 'thumbnail' : Url of image thumbnail , 'source_url' : The webpage the image was found on , 'source' : The base url of the source }Die Verwendung ähnelt den vorherigen Funktionen:
import GoogleImageScraper
image_objects = GoogleImageScraper . image_objects ( query , limit , arguments )Verwenden Sie diese Funktion, um ein Bild über URL herunterzuladen. Diese Funktion unterscheidet sich vom Rest, als sie unterschiedliche Eingabeargumente annimmt, die unten angegeben sind:
| Argument | Typen | Beschreibung |
|---|---|---|
| URL | str | Die URL zum Herunterladen des Bildes. *erforderlich* |
| Name | str | Der Name der Datei. Fügen Sie keine Dateierweiterung hinzu. *erforderlich* |
| Weg | str | Der Pfad zum Herunterladen des Bildes auf. |
| Download_Format | str | Das Format zum Herunterladen des Bildes dauert eine Weile länger |
| überschreiben | bool | Ob Überschreiben von Dateien mit demselben Namen. Standardmäßig True . Erhöht FileExistsError , wenn False und die Datei existiert. |
Es besteht die Möglichkeit, dass Sie möglicherweise nicht die Anzahl der im Grenzargument angegebenen Bilder erreichen. Dies tritt auf, wenn ein Fehler beim Herunterladen eines Bildes vorliegt, unabhängig davon, ob es sich nicht um ein Bildformat oder die Anforderungszeiten befindet, kann dies geschehen. Beim Herunterladen einer großen Anzahl von Bildern kann dies dazu führen, dass Ihre Grenze nicht erreicht wird. Das "Fehler" -Punkt im zurückgegebenen Wörterbuch aus Downloads ist Ihre Art, dies zu verfolgen. Wenn Ihr Limit beispielsweise 100 betrug und 3 Bilder Fehler warf, würden Sie 97 Bilder zurückholen, und das Element "Fehler" wäre 3., wenn Ihr Limit 20 beträgt, und 3 Bilder haben Fehler geworfen, Sie würden immer noch 20 Elemente zurückbekommen, und der Artikel "Fehler" würde 0 sein.
| Fehler | Beschreibung |
|---|---|
LimitError | Erhöht, wenn das Grenzargument über 100 liegt oder nicht über den richtigen Typ. |
ArgumentError | Erhöht, wenn ein ungültiger Wert für ein Argument angegeben wird |
QueryError | Erhöht, wenn es keine Anfrage gibt oder die Abfrage nicht der richtige Typ ist |
UnpackError | Erhöht, wenn auf der Seite keine Bilder gefunden werden. |
DownloadError | Exklusiv für die Funktion Download_image . Erhöht, wenn das Bild nicht heruntergeladen wurde. |
Fügen Sie diese wie so ein:
from GoogleImageScraper . errors import < error >Einige wirkliche Beispiele sind hier aufgeführt:
import GoogleImageScraper
urls = GoogleImageScraper . urls ( query = 'cats' , limit = 10 , arguments = { 'color' : 'black' })Ergebnis:
[ 'https://www.rd.com/wp-content/uploads/2021/01/GettyImages-1175550351.jpg' ,
'https://www.history.com/.image/ar_4:3%2Cc_fill%2Ccs_srgb%2Cfl_progressive%2Cq_auto:good%2Cw_1200/MTg0NTEzNzgyNTMyNDE2OTk5/black-cat-gettyimages-901574784.jpg' ,
'https://www.thesprucepets.com/thmb/kF3_dQW_JT1ClMQDlISxq3BgeT4=/6843x5132/smart/filters:no_upscale()/facts-about-black-cats-554102-hero-7281a22d75584d448290c359780c2ead.jpg' ,
'https://i.guim.co.uk/img/media/c5e73ed8e8325d7e79babf8f1ebbd9adc0d95409/2_5_1754_1053/master/1754.jpg?width=465&quality=45&auto=format&fit=max&dpr=2&s=065f279099ded1062688e357b155dc29' ,
'https://cdn.cnn.com/cnnnext/dam/assets/141030105303-kiki-irpt.jpg' ,
'https://imagesvc.meredithcorp.io/v3/mm/image?url=https%3A%2F%2Fstatic.onecms.io%2Fwp-content%2Fuploads%2Fsites%2F34%2F2021%2F09%2F27%2Fblack-cat-kitchen-rug-getty-0921-2000.jpg' ,
'https://www.gannett-cdn.com/presto/2021/10/28/USAT/1bf79c6a-5d88-4e64-b398-c40418a79829-XXX_iStock_000017680551Large.jpg' ,
'https://cdn.sanity.io/images/0vv8moc6/dvm360/f28cc9b680aed62edd018ce47a5cbb96c4f78f3b-4860x3024.jpg' ,
'https://vbspca.com/wp-content/uploads/2019/10/Image-e1570199876255.jpeg' ,
'https://ichef.bbci.co.uk/news/976/cpsprodpb/AECE/production/_99805744_gettyimages-625757214.jpg' ] import GoogleImageScraper
images = GoogleImageScraper . download ( query = 'dogs' , limit = 1 , arguments = { 'color' : 'brown' , 'download_format' : 'png' })Ergebnis:
{ 'images' : [{ 'path' : '<path> \ images \ dogs-0.png' , 'url' : 'https://post.medicalnewstoday.com/wp-content/uploads/sites/3/2020/02/322868_1100-800x825.jpg' }], 'errors' : 0 } import GoogleImageScraper
objects = GoogleImageScraper . image_objects ( query = 'birds' , limit = 1 , arguments = { 'color' : 'yellow' })Ergebnisse:
[{ 'thumbnail' : 'https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcQwDI5y3_n2rwFQLZKrBXs5VL_J38zlZVvdZAooD8F8d7lY8ZA9iLEb1-AoBBWpGftpdoc&usqp=CAU' , 'url' : 'https://www.sfvaudubon.org/wp-content/uploads/2020/03/YEWAcrop.jpg' , 'source_url' : 'https://www.sfvaudubon.org/sfv-backyard-bird-identification/' , 'source' : 'sfvaudubon.org' }, { 'thumbnail' : 'https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcR1k5IhGCAPgU468tyPrgkuY9WC3T83zRxzFrTOOUs0OL_kanPG8VPKXV3euijAlzW9AsE&usqp=CAU' , 'url' : 'https://ca.audubon.org/sites/default/files/styles/article_teaser/public/yellowwarbler_peter_latourrette.jpg?itok=PFRtxcGN' , 'source_url' : 'https://ca.audubon.org/birds-0' , 'source' : 'ca.audubon.org' }]