baal Téléchargement - baal Source Code Download

baal

Autre code source

Baal 2.0: Experiment API

Télécharger

Apprentissage actif bayésien (Baal)

Baal est une bibliothèque d'apprentissage active qui soutient à la fois les applications industrielles et les utilisations de recherche.

Lisez la documentation sur https://baal.readthedocs.io.

Notre article peut être lu sur Arxiv. Il comprend des conseils et des astuces pour rendre l'apprentissage actif utilisable en production.

Pour une introduction rapide à l'apprentissage actif de Baal et bayésien, veuillez consulter ces liens:

Séminaire avec studio de label
Guide de l'utilisateur
Présentation de l'apprentissage actif bayésien

Baal a été initialement développé à Elementai (acquis par ServiceNow en 2021), mais est désormais indépendant.

Installation et exigences

Baal nécessite Python>=3.8 .

Pour installer Baal à l'aide de PIP: pip install baal

Nous utilisons la poésie comme gestionnaire de packages. Pour installer Baal à partir de Source: poetry install

Documents utilisant Baal

Apprentissage actif bayésien pour la production, une étude systématique et une bibliothèque réutilisable (Atighehchian et al. 2020)
Synbols: sond des algorithmes d'apprentissage avec des ensembles de données synthétiques (Lacoste et al. 2020)
L'apprentissage actif peut-il atténuer les problèmes d'équité de manière préventive? (Branchaud-Charron et al. 2021)
L'apprentissage actif avec Maskal réduit l'effort d'annotation pour la formation du masque R-CNN (Blok et al. 2021)
Acquisition de lots stochastiques pour l'apprentissage actif profond (Kirsch et al. 2022)

Qu'est-ce que l'apprentissage actif?

L'apprentissage actif est un cas particulier d'apprentissage automatique dans lequel un algorithme d'apprentissage est en mesure d'interroger de manière interactive l'utilisateur (ou une autre source d'information) pour obtenir les sorties souhaitées aux nouveaux points de données (pour comprendre le concept plus en profondeur, reportez-vous à notre tutoriel ).

Framework baal

À l'heure actuelle, Baal prend en charge les méthodes suivantes pour effectuer un apprentissage actif.

Dropout Monte-Carlo (Gal et al. 2015)
McDropConnect (Mobiny et al. 2019)
Ensembles profonds
Apprentissage semi-supervisé

Si vous souhaitez proposer de nouvelles méthodes, veuillez soumettre un problème.

La méthode d'abandon de Monte-Carlo est une approximation connue pour les réseaux de neurones bayésiens. Dans cette méthode, la couche d'abandon est utilisée à la fois en formation et en temps de test. En exécutant le modèle plusieurs fois tout en supprimant au hasard des poids, nous calculons l'incertitude de la prédiction en utilisant l'une des mesures d'incertitude dans heuristics.py.

Le cadre se compose de quatre pièces principales, comme le montre l'organigramme ci-dessous:

ActiveLearningDataset
Heuristique
Mannequin
Activearningloop

Pour commencer, enveloppez votre ensemble de données dans notre classe ActiveLearningDataset . Cela garantira que l'ensemble de données est divisé en training et des ensembles pool . L'ensemble pool représente la partie de l'ensemble de formation qui n'a pas encore été étiqueté.

Nous fournissons un modèle de modèle d'objet léger similaire à keras.Model pour faciliter la formation et le test du modèle. Si votre modèle n'est pas prêt pour l'apprentissage actif, nous fournissons des modules pour les préparer.

Par exemple, l'emballage McDropoutModule modifie la couche d'abandon existante à utiliser à la fois dans la formation et le temps d'inférence et le ModelWrapper fait que le nombre d'itérations à fonctionner à la formation et à l'inférence.

Enfin, ActiveLearningLoop calcule automatiquement l'incertitude et étiquetez les éléments les plus incertains de la piscine.

En conclusion, votre script devrait être similaire à ceci:

 dataset = ActiveLearningDataset ( your_dataset )
dataset . label_randomly ( INITIAL_POOL )  # label some data
model = MCDropoutModule ( your_model )
wrapper = ModelWrapper ( model , args = TrainingArgs (...))
experiment = ActiveLearningExperiment (
    trainer = wrapper , # Huggingface or ModelWrapper to train
    al_dataset = dataset , # Active learning dataset
    eval_dataset = test_dataset , # Evaluation Dataset
    heuristic = BALD (), # Uncertainty heuristic to use
    query_size = 100 , # How many items to label per round.
    iterations = 20 , # How many MC sampling to perform per item.
    pool_size = None , # Optionally limit the size of the unlabelled pool.
    criterion = None # Stopping criterion for the experiment.
)
# The experiment will run until all items are labelled.
metrics = experiment . start ()

Pour une expérience complète, voir Experiments / VGG_MCDROPOUT_CIFAR10.py .

Reposez nos expériences

docker build [--target base_baal] -t baal .
docker run --rm baal --gpus all python3 experiments/vgg_mcdropout_cifar10.py

Utilisez Baal pour vos expériences

Clonez simplement le repo et créez votre propre script d'expérience similaire à l'exemple dans Experiments / VGG_MCDROPOUT_CIFAR10.py . Assurez-vous d'utiliser les quatre parties principales de Baal Framework. Expériences de course heureuses

Contribution!

Pour contribuer, voir contribution.md.

Qui nous sommes!

"Il y a de la passion, mais de la paix; sérénité, mais émotion; chaos, mais l'ordre."

L'équipe Baal teste et met en œuvre les articles les plus récents sur l'estimation de l'incertitude et l'apprentissage actif.

RETENUSEURS COURANTS:

Parmida Atighehchian
Frédéric Branchaud-charron
George Pearse

Comment citer

Si vous avez utilisé Baal dans l'un de vos projets, nous apprécierions grandement si vous citez cette bibliothèque en utilisant ce bibtex:

 @misc{atighehchian2019baal,
  title={Baal, a bayesian active learning library},
  author={Atighehchian, Parmida and Branchaud-Charron, Frederic and Freyberg, Jan and Pardinas, Rafael and Schell, Lorne
          and Pearse, George},
  year={2022},
  howpublished={url{https://github.com/baal-org/baal/}},
}

Licence

Pour obtenir des informations sur la licence de cette API, veuillez lire la licence

Développer

Informations supplémentaires

Version Baal 2.0: Experiment API
Type Autre code source
Date de mise à jour 2025-02-24
taille 19.46MB
Provenant de Github

Applications connexes

Google Dorks

2025-03-10
shepherd

2025-06-04
hidusbf

2025-02-14
mongo express

2025-06-04
Free Algorithms Books

2025-05-29
markdownpedia

2025-04-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
hidusbf

Autre code source

1.0.0

Actualités connexes Tout