kaggle_downloader_package
1.0.0
KaggleDownloader 는 Kaggle과 상호 작용하도록 설계된 Python 클래스로, 사용자가 데이터 세트를 인증, 검색, 다운로드 및 추출 할 수 있도록합니다. 이 클래스는 Jupyter 노트북 또는 명령 줄을 통해 대화식으로 사용할 수 있습니다.
KaggleDownloader 클래스를 사용하기 전에 다음과 같습니다.
Jupyter 노트북 내에서 직접 KaggleDownloader 가져오고 사용할 수 있습니다. 아래는 클래스 메소드를 사용하여 데이터 세트를 인증하고 다운로드하기위한 단계별 안내서입니다.
import kaggle_downloader as kd # Assuming you've saved the class in kaggle_downloader.py
import pandas as pd
# Initialize KaggleDownloader
downloader = kd . KaggleDownloader ( api_token_path = "./kaggle.json" )
# Authenticate with Kaggle API
downloader . authenticate_kaggle ()
# Search for datasets related to a theme
downloader . search_datasets ( "netflix" )
# Download a specific dataset by its slug
downloader . download_dataset ( "shivamb/netflix-shows" )
df = pd . read_csv ( "./netflix_titles.csv" , delimiter = ',' , encoding = "utf-8" , encoding_errors = "replace" )
df . head ()get_api_token_path() : 기본 Kaggle API 토큰 파일로 경로를 반환합니다.get_alternative_token_path() : 대체 Kaggle API 토큰 파일로의 경로를 반환합니다.get_path_downloads() : 다운로드 디렉토리 경로를 반환합니다.set_api_token_path(new_path) : Kaggle API 토큰의 새로운 경로를 설정합니다.set_alternative_token_path(new_path) : 대체 Kaggle API 토큰의 새로운 경로를 설정합니다.set_path_downloads(new_path) : 다운로드 된 데이터 세트에 대한 새로운 경로를 설정합니다.authenticate_kaggle() : 토큰 파일에서 자격 증명을로드하여 Kaggle API와 함께 Authenticates.authenticate_with_credentials() : 사용자에게 수동으로 Kaggle 자격 증명을 입력하여 파일에 저장하도록하려면.search_datasets(dataset_theme) : 주어진 키워드 또는 테마와 일치하는 데이터 세트에 대한 검색 Kaggle을 검색합니다.download_dataset(dataset_slug) : Kaggle에서 지정된 디렉토리로 데이터 세트를 다운로드합니다.extract_zip(zip_file) : 다운로드 된 zip 파일을 다운로드 디렉토리로 추출합니다.check_kaggle_json() : Kaggle API 토큰 파일이 기본 또는 대체 경로에 있는지 확인합니다.create_download_directory(path) : 데이터 세트가 아직 존재하지 않으면 저장 될 디렉토리를 만듭니다. 또는 명령 줄을 통해 KaggleDownloader 클래스를 사용할 수 있습니다. main() 메소드를 사용하면 사용자가 데이터 세트 슬러그를 인수로 지정하여 클래스를 실행하고 데이터 세트를 다운로드 할 수 있습니다.
먼저 스크립트가 실행 가능한지 확인하십시오.
chmod +x kaggle_downloader.py다음 명령을 사용하여 Kaggle에서 데이터 세트를 다운로드하십시오.
python kaggle_downloader_package/kaggle_downloader.py benroshan/ecommerce-data 이렇게하면 Kaggle ( kaggle.json 토큰 파일을 기반으로)으로 인증하고 path_downloads 에 지정된 디렉토리 (또는 기본적으로 현재 작업 디렉토리)에 데이터 세트를 다운로드합니다.
dataset_slug : 다운로드하려는 Kaggle DataSet Identifier (SLUG) (예 : benroshan/ecommerce-data . kaggle.json ).kaggle_downloader.py 실제 파일 이름으로 바꾸십시오.from kaggle_downloader import KaggleDownloader )를 조정하십시오. GitHub에서 문제, 기능 요청 또는 요청을 제출 하여이 프로젝트에 자유롭게 기여하십시오.
이 프로젝트는 MIT 라이센스에 따라 라이센스가 부여됩니다. 자세한 내용은 LICENSE 파일을 참조하십시오.
마리아노 고베 아 알코바
이메일 : [email protected]