Grattez automatiquement les images avec votre requête à partir des moteurs de recherche populaires
Utilisation d'un frontend facile à utiliser ou à l'aide de scripts.

Ce code fait partie d'un article (citation), vérifiez également la page du projet si vous êtes intéressé à la création d'un ensemble de données par la segmentation par instance.
Démarrez l'extrémité frontale avec une seule commande (ajustez le /PATH/TO/OUTPUT sur le chemin de sortie souhaité)
docker run -it --rm --name easy_image_scraping --mount type=bind,source=/PATH/TO/OUTPUT,target=/usr/src/app/output -p 5000:5000 ghcr.io/a-nau/easy-image-scraping:latest Entrez votre requête et attendez que les résultats s'affichent dans le dossier output . Les applications Web montrent également un aperçu des images téléchargées.
Commencez à utiliser la ligne de commande avec
docker run -it --rm --name easy_image_scraping --mount type=bind,source=/PATH/TO/OUTPUT,target=/usr/src/app/output -p 5000:5000 ghcr.io/a-nau/easy-image-scraping:latest bash Si vous souhaitez simplement rechercher un seul mot-clé ajustez et exécutez search_by_keyword.py
search_terms_eng.txt .config.py pour définir les moteurs de recherche pour chaque languesearch_by_keywords_from_files Ceci est facultatif - vous pouvez également utiliser directement notre conteneur fourni.
Vous pouvez également construire l'image vous-même en utilisant
docker build -t easy_image_scraping .L'exécution en utilisant
docker run -it --rm --name easy_image_scraping -p 5000:5000 --mount type=bind,source=/PATH/TO/OUTPUT,target=/usr/src/app/output easy_image_scrapingconda env create -f environment.ymlpip install -r requirements.txt with webdriver . Chrome (
executable_path = "path/to/chrome_diver.exe" , # add this line
options = set_chrome_options ()
) as wd :Sauf indication contraire, ce projet est sous licence en vertu de la licence du MIT.
Si vous utilisez ce code pour la recherche scientifique, veuillez envisager de citer
@inproceedings{naumannScrapeCutPasteLearn2022,
title = {Scrape, Cut, Paste and Learn: Automated Dataset Generation Applied to Parcel Logistics},
author = {Naumann, Alexander and Hertlein, Felix and Zhou, Benchun and Dörr, Laura and Furmans, Kai},
booktitle = {{{IEEE Conference}} on {{Machine Learning}} and Applications ({{ICMLA}})},
date = 2022
}Veuillez être conscient des restrictions du droit d'auteur qui pourraient s'appliquer aux images que vous téléchargez.