kaggle_downloader_package
1.0.0
KaggleDownloader 、Kaggleと対話するように設計されたPythonクラスであり、ユーザーがデータセットを認証、検索、ダウンロード、抽出できるようにします。クラスは、Jupyterノートブックまたはコマンドラインでインタラクティブに使用できます。
KaggleDownloaderクラスを使用する前に、次のことを確認してください。
Jupyterノートブック内で、 KaggleDownloader直接インポートおよび使用できます。以下は、クラスメソッドを使用してデータセットを認証およびダウンロードするためのステップバイステップガイドです。
import kaggle_downloader as kd # Assuming you've saved the class in kaggle_downloader.py
import pandas as pd
# Initialize KaggleDownloader
downloader = kd . KaggleDownloader ( api_token_path = "./kaggle.json" )
# Authenticate with Kaggle API
downloader . authenticate_kaggle ()
# Search for datasets related to a theme
downloader . search_datasets ( "netflix" )
# Download a specific dataset by its slug
downloader . download_dataset ( "shivamb/netflix-shows" )
df = pd . read_csv ( "./netflix_titles.csv" , delimiter = ',' , encoding = "utf-8" , encoding_errors = "replace" )
df . head ()get_api_token_path() :プライマリKaggle APIトークンファイルへのパスを返します。get_alternative_token_path() :代替Kaggle APIトークンファイルへのパスを返します。get_path_downloads() :ダウンロードディレクトリパスを返します。set_api_token_path(new_path) :Kaggle APIトークンの新しいパスを設定します。set_alternative_token_path(new_path) :代替Kaggle APIトークンの新しいパスを設定します。set_path_downloads(new_path) :ダウンロードされたデータセットの新しいパスを設定します。authenticate_kaggle() :トークンファイルから資格情報をロードすることにより、Kaggle APIを使用して認証します。authenticate_with_credentials() :ユーザーに手動でKaggle資格情報を入力し、ファイルに保存するように求めます。search_datasets(dataset_theme) :特定のキーワードまたはテーマに一致するデータセットのKaggleを検索します。download_dataset(dataset_slug) :kaggleから指定されたディレクトリまでのデータセットをダウンロードします。extract_zip(zip_file) :ダウンロードしたzipファイルをダウンロードディレクトリに抽出します。check_kaggle_json() :Kaggle APIトークンファイルがプライマリパスまたは代替パスのいずれかに存在するかどうかを確認します。create_download_directory(path) :データセットがまだ存在しない場合、データセットが保存されるディレクトリを作成します。 または、コマンドラインを介してKaggleDownloaderクラスを使用することもできます。 main()メソッドを使用すると、ユーザーはクラスを実行し、データセットスラッグを引数として指定してデータセットをダウンロードできます。
まず、スクリプトが実行可能であることを確認してください。
chmod +x kaggle_downloader.py次のコマンドを使用して、Kaggleからデータセットをダウンロードします。
python kaggle_downloader_package/kaggle_downloader.py benroshan/ecommerce-dataこれにより、Kaggle( kaggle.jsonトークンファイルに基づいて)で認証され、データセットをpath_downloads (またはデフォルトで現在の作業ディレクトリ)で指定したディレクトリにダウンロードします。
dataset_slug :たとえば、 benroshan/ecommerce-dataをダウンロードしたいKaggle Dataset識別子(SLUG)。 kaggle.json )。kaggle_downloader.py違う場合は実際のファイル名に置き換えます。from kaggle_downloader import KaggleDownloader )コードを別の方法で整理します。 GitHubで問題、機能リクエスト、またはプルリクエストを提出して、このプロジェクトに自由に貢献してください。
このプロジェクトは、MITライセンスの下でライセンスされています。詳細については、 LICENSEファイルを参照してください。
マリアーノゴベアアルコバ
メール:[email protected]