이것은 Google 이미지에서 이미지를 검색하고 다운로드하기위한 라이브러리입니다.
입력 쿼리 및 인수를 사용하여 이미지 객체를 검색하고 검색합니다. 이 이미지는 저작권 하에서 보호 될 수 있으며 상업용 사용을 위해 사용하는 것과 같이 처벌 할 수있는 일을해서는 안됩니다. 이 라이브러리는 Hardikvasa 의 google-images-download 에서 영감을 얻었지만 URL을 검색 할 수있는 것과 같은 몇 가지 품질의 개선을 추가합니다. 그러나이 도서관은 그들의 일 없이는 불가능하고, 계속하기 위해 노력하는 사람들은 불가능할 것입니다.
두 가지 주요 기능 모두에 필요한 주장과 두 가지 주장이 있습니다.
| 논쟁 | 유형 | 설명 |
|---|---|---|
| 질문: | str, 목록 | 검색 할 키워드가 포함 된 문자열 또는 목록. 쿼리가 문자열 인 경우 공백별로 다른 키워드로 분리됩니다. |
| 한계 | int | 검색 할 이미지의 양. 100보다 클 수 없습니다. *기본값은 1 * |
| 논쟁 : | DITT | 이것은 많은 선택적 값을 포함하는 사전이며, 모두 여기에 나열됩니다. 그것들은 두 가지 범주로 나뉩니다 : 인수 검색 및 인수 다운로드 |
| 논쟁 | 유형 | 설명 |
|---|---|---|
| 다운로드 _format | str | 모든 이미지를 다운로드 할 파일 확장자를 지정합니다. PIL 에서 인식하는 유효한 이미지 파일 확장자 여야합니다. *참고 : 많은 양의 이미지에 따라 훨씬 더 오래 걸립니다* |
| 예배 규칙서 | str | 이것은 이미지를 다운로드 할 디렉토리 이름을 지정합니다. 디렉토리가 이미 존재하거나 경로가 지정되지 않는 한 기능이 호출되는 디렉토리에서 자동으로 생성됩니다. |
| 길 | str | 이것은 다운로드 디렉토리를 만들기위한 경로를 지정합니다. |
| 시간 초과 | int float | 이것은 프로그램이 단일 이미지를 몇 초 만에 검색하기 위해 기다리는 최대 시간을 지정합니다. |
| 말 수가 많은 | 부 | 콘솔 진행 상황에 대한 업데이트를 인쇄하려면 True 로 설정하십시오. |
| 논쟁 | 허용 된 값 | 설명 |
|---|---|---|
| 색상 | '빨간색', '오렌지', '노란색', '녹색', '청록색', '파란색', '보라색', '핑크', '화이트', '회색', '검은 색', '갈색' | 지배적 인 색상으로 이미지를 필터링합니다. |
| color_type | '전체', '그레이 스케일', '투명' | 색상 유형, 풀 컬러, 그레이 스케일 또는 투명으로 이미지를 필터링합니다. |
| 특허 | 'Creative_commons', 'Other_Licenses' | 사용 라이센스로 이미지를 필터링합니다. |
| 유형 | 'face', 'photo', 'clipart', 'lineart', 'gif' | 검색 할 이미지 유형별 필터. * search_format와 혼동하지 않으려면 * |
| 시간 | 'past_day', 'past_week', 'past_month', 'past_year' | 지정된 시간에 게시 된 이미지 만 찾습니다. |
| SACES_RATIO | '키가', '사각형', '넓은', '파노라마' | 이미지의 종횡비를 지정합니다. |
| search_format | 'jpg', 'gif', 'png', 'bmp', 'svg', 'webp', 'ico', 'raw' | 지정된 형식이 아닌 이미지를 필터링합니다. 특정 형식으로 이미지를 다운로드하려면 대신 'Download_Format'인수를 사용하십시오. |
사용 가능한 4 가지 기능, 다운로드 , URL , Image_Objects 및 Download_Image 는 다른 기능과 다르게 작동합니다.
import GoogleImageScraper
images = GoogleImageScraper ( query , limit , arguments )이것은 인수에 따라 이미지를 다운로드합니다. 반환 된 값은이 형식을 따릅니다.
{ 'images' : [ images ], 'errors' : Number of Errors }이미지 목록의 각 이미지는 특정 형식을 따릅니다.
{ 'path' : Image Path , 'url' : Image Url } import GoogleImageScraper
urls = GoogleImageScraper . urls ( query , limit , arguments )이 기능은 단순히 검색어에서 이미지 URL 목록을 반환합니다.
이 기능은 조금 더 틈새 시장이지만 일부 사람들에게는 유용 할 수 있습니다. URL 기능과 같은 이미지 URL 목록을 반환하는 대신 유용한 데이터가 포함 된 이미지 객체 목록을 반환합니다.
{ 'url' : Image url , 'thumbnail' : Url of image thumbnail , 'source_url' : The webpage the image was found on , 'source' : The base url of the source }사용법은 이전 기능과 유사합니다.
import GoogleImageScraper
image_objects = GoogleImageScraper . image_objects ( query , limit , arguments )이 기능을 사용하여 URL을 통해 이미지를 다운로드하십시오. 이 기능은 아래에 제공되는 다른 입력 인수를 사용한다는 점에서 나머지와 다릅니다.
| 논쟁 | 유형 | 설명 |
|---|---|---|
| URL | str | 이미지를 다운로드 할 URL. *필수의* |
| 이름 | str | 파일의 이름. 파일 확장자를 포함하지 마십시오. *필수의* |
| 길 | str | 이미지를 다운로드하는 경로. |
| 다운로드 _format | str | 이미지를 다운로드하는 형식은 시간이 더 걸립니다 . |
| 덮어 쓰기 | 부 | 동일한 이름으로 파일을 덮어 쓸지 여부. 기본값은 True . False 와 파일이 존재하는 경우 FileExistsError 올리십시오. |
한계 인수에 지정된 이미지 수에 도달하지 못할 가능성이 있습니다. 이미지가 이미지 형식에 있지 않든 이미지를 다운로드하는 오류가 발생하거나 요청 시간이 발생하면 발생할 수 있습니다. 많은 양의 이미지를 다운로드 할 때 제한에 도달하지 못할 수 있습니다. 다운로드에서 반환 된 사전의 '오류' 항목은이를 추적하는 방법입니다. 예를 들어, 한계 가 100이고 3 개의 이미지가 오류를 던지면 97 개의 이미지를 다시 얻을 수 있고 '오류' 항목은 3이 될 것입니다. 그러나 이제 제한이 20 인 경우 3 개의 이미지가 오류를 던지면 여전히 20 개의 항목을 다시 얻을 수 있으며 '오류' 항목은 0이 될 수 있습니다. 이는 최대 100 개의 URL이 찾을 수 있기 때문에 오류가 증가 할 가능성이 높아질 수 있습니다.
| 오류 | 설명 |
|---|---|
LimitError | 한계 인수가 100 이상이거나 적절한 유형이 아닌 경우 제기됩니다. |
ArgumentError | 인수에 대해 잘못된 가치가 주어지면 제기 |
QueryError | 쿼리가 없거나 쿼리가 올바른 유형이 아닌 경우 제기 |
UnpackError | 페이지에 이미지가없는 경우 제기됩니다. |
DownloadError | Download_Image 함수에 전용. 이미지가 다운로드되지 않으면 제기되었습니다. |
이것들과 같은 것들을 포함하십시오.
from GoogleImageScraper . errors import < error >몇 가지 실제 예가 여기에 나와 있습니다.
import GoogleImageScraper
urls = GoogleImageScraper . urls ( query = 'cats' , limit = 10 , arguments = { 'color' : 'black' })결과:
[ 'https://www.rd.com/wp-content/uploads/2021/01/GettyImages-1175550351.jpg' ,
'https://www.history.com/.image/ar_4:3%2Cc_fill%2Ccs_srgb%2Cfl_progressive%2Cq_auto:good%2Cw_1200/MTg0NTEzNzgyNTMyNDE2OTk5/black-cat-gettyimages-901574784.jpg' ,
'https://www.thesprucepets.com/thmb/kF3_dQW_JT1ClMQDlISxq3BgeT4=/6843x5132/smart/filters:no_upscale()/facts-about-black-cats-554102-hero-7281a22d75584d448290c359780c2ead.jpg' ,
'https://i.guim.co.uk/img/media/c5e73ed8e8325d7e79babf8f1ebbd9adc0d95409/2_5_1754_1053/master/1754.jpg?width=465&quality=45&auto=format&fit=max&dpr=2&s=065f279099ded1062688e357b155dc29' ,
'https://cdn.cnn.com/cnnnext/dam/assets/141030105303-kiki-irpt.jpg' ,
'https://imagesvc.meredithcorp.io/v3/mm/image?url=https%3A%2F%2Fstatic.onecms.io%2Fwp-content%2Fuploads%2Fsites%2F34%2F2021%2F09%2F27%2Fblack-cat-kitchen-rug-getty-0921-2000.jpg' ,
'https://www.gannett-cdn.com/presto/2021/10/28/USAT/1bf79c6a-5d88-4e64-b398-c40418a79829-XXX_iStock_000017680551Large.jpg' ,
'https://cdn.sanity.io/images/0vv8moc6/dvm360/f28cc9b680aed62edd018ce47a5cbb96c4f78f3b-4860x3024.jpg' ,
'https://vbspca.com/wp-content/uploads/2019/10/Image-e1570199876255.jpeg' ,
'https://ichef.bbci.co.uk/news/976/cpsprodpb/AECE/production/_99805744_gettyimages-625757214.jpg' ] import GoogleImageScraper
images = GoogleImageScraper . download ( query = 'dogs' , limit = 1 , arguments = { 'color' : 'brown' , 'download_format' : 'png' })결과:
{ 'images' : [{ 'path' : '<path> \ images \ dogs-0.png' , 'url' : 'https://post.medicalnewstoday.com/wp-content/uploads/sites/3/2020/02/322868_1100-800x825.jpg' }], 'errors' : 0 } import GoogleImageScraper
objects = GoogleImageScraper . image_objects ( query = 'birds' , limit = 1 , arguments = { 'color' : 'yellow' })결과:
[{ 'thumbnail' : 'https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcQwDI5y3_n2rwFQLZKrBXs5VL_J38zlZVvdZAooD8F8d7lY8ZA9iLEb1-AoBBWpGftpdoc&usqp=CAU' , 'url' : 'https://www.sfvaudubon.org/wp-content/uploads/2020/03/YEWAcrop.jpg' , 'source_url' : 'https://www.sfvaudubon.org/sfv-backyard-bird-identification/' , 'source' : 'sfvaudubon.org' }, { 'thumbnail' : 'https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcR1k5IhGCAPgU468tyPrgkuY9WC3T83zRxzFrTOOUs0OL_kanPG8VPKXV3euijAlzW9AsE&usqp=CAU' , 'url' : 'https://ca.audubon.org/sites/default/files/styles/article_teaser/public/yellowwarbler_peter_latourrette.jpg?itok=PFRtxcGN' , 'source_url' : 'https://ca.audubon.org/birds-0' , 'source' : 'ca.audubon.org' }]