
YDF (YGGDRASIL DÉCISION FORESSAUX) est une bibliothèque pour former, évaluer, interpréter et servir des forêts aléatoires, des arbres de décision stimulés par le gradient, des modèles de forêt et d'isolement.
Voir la documentation pour plus d'informations sur YDF.
Pour installer YDF à partir de PYPI, exécutez:
pip install ydf -U import ydf
import pandas as pd
# Load dataset with Pandas
ds_path = "https://raw.githubusercontent.com/google/yggdrasil-decision-forests/main/yggdrasil_decision_forests/test_data/dataset/"
train_ds = pd . read_csv ( ds_path + "adult_train.csv" )
test_ds = pd . read_csv ( ds_path + "adult_test.csv" )
# Train a Gradient Boosted Trees model
model = ydf . GradientBoostedTreesLearner ( label = "income" ). train ( train_ds )
# Look at a model (input features, training logs, structure, etc.)
model . describe ()
# Evaluate a model (e.g. roc, accuracy, confusion matrix, confidence intervals)
model . evaluate ( test_ds )
# Generate predictions
model . predict ( test_ds )
# Analyse a model (e.g. partial dependence plot, variable importance)
model . analyze ( test_ds )
# Benchmark the inference speed of a model
model . benchmark ( test_ds )
# Save the model
model . save ( "/tmp/my_model" )Exemple avec l'API C ++.
auto dataset_path = " csv:train.csv " ;
// List columns in training dataset
DataSpecification spec;
CreateDataSpec (dataset_path, false , {}, &spec);
// Create a training configuration
TrainingConfig train_config;
train_config.set_learner( " RANDOM_FOREST " );
train_config.set_task(Task::CLASSIFICATION);
train_config.set_label( " my_label " );
// Train model
std::unique_ptr<AbstractLearner> learner;
GetLearner (train_config, &learner);
auto model = learner-> Train (dataset_path, spec);
// Export model
SaveModel ( " my_model " , model.get());(basé sur des exemples / débutant.cc)
Vérifiez le tutoriel de démarrage ?.
Si vous, les forêts de la décision de nous yggdrasil, dans une publication scientifique, veuillez citer l'article suivant: Forêts de décision YGGDRASIL: Une bibliothèque de forêts de décision rapide et extensible.
Bibtex
@inproceedings{GBBSP23,
author = {Mathieu Guillame{-}Bert and
Sebastian Bruch and
Richard Stotz and
Jan Pfeifer},
title = {Yggdrasil Decision Forests: {A} Fast and Extensible Decision Forests
Library},
booktitle = {Proceedings of the 29th {ACM} {SIGKDD} Conference on Knowledge Discovery
and Data Mining, {KDD} 2023, Long Beach, CA, USA, August 6-10, 2023},
pages = {4068--4077},
year = {2023},
url = {https://doi.org/10.1145/3580305.3599933},
doi = {10.1145/3580305.3599933},
}
Brut
Forêts de décision YGGDRASIL: A Fast and Extensible Decision Forests Library, Guillame-Bert et al., KDD 2023: 4068-4077. doi: 10.1145 / 3580305.3599933
Vous pouvez contacter l'équipe de développement de base à [email protected].
Les forêts de décision Yggdrasil et les forêts de décision Tensorflow sont développées par:
Les contributions aux forêts de décision Tensorflow et aux forêts de décision YGGDRASIL sont les bienvenues. Si vous souhaitez contribuer, vérifiez les directives de contribution.
Licence Apache 2.0