
Apprentissage actif pour la classification du texte dans Python.
Installation | Démarrage rapide | Contribution | ChangeLog | Docs
Small-Text fournit un apprentissage actif de pointe pour la classification du texte. Plusieurs stratégies de requête pré-implémentées, stratégies d'initialisation et critères d'arrêt sont fournies, qui peuvent être facilement mélangées et appariées pour construire des expériences ou des applications d'apprentissage actifs.
L'apprentissage actif vous permet d'étiqueter efficacement les données de formation pour l'apprentissage supervisé dans un scénario où vous avez peu ou pas de données étiquetées.
Version 2.0.0 Dev1 (v2.0.0.dev1) - 24 novembre 2024
Version 1.4.1 (V1.4.1) - 18 août 2024
Version 1.4.0 (V1.4.0) - 9 juin 2024
Document publié à EACL 2023?
Pour une liste complète des modifications, consultez le journal des modifications.
Le petit texte peut être facilement installé via PIP:
pip install small-text La commande se traduit par une installation mince avec uniquement les dépendances nécessaires. Pour une installation complète via PIP, il vous suffit d'inclure l'exigence supplémentaire transformers :
pip install small-text[transformers]La bibliothèque nécessite Python 3.8 ou plus récente. Pour l'utilisation du GPU, CUDA 10.1 ou plus nouveau est requis. Plus d'informations sur l'installation peuvent être trouvées dans la documentation.
Pour un démarrage rapide, consultez les exemples fournis pour la classification binaire, la classification multi-classes Pytorch et la classification multi-classes basée sur les transformateurs, ou consultez les ordinateurs portables.
| # | Carnet de notes | |
|---|---|---|
| 1 | Intro: apprentissage actif pour la classification du texte avec petit texte | |
| 2 | Utiliser des critères d'arrêt pour l'apprentissage actif | |
| 3 | Apprentissage actif à l'aide de setFit | |
| 4 | Utilisation des capacités de tir zéro de SetFit pour l'initialisation de démarrage à froid |
Une liste complète des vitrines peut être trouvée dans les documents.
? Souhaitez-vous partager votre cas d'utilisation? Peu importe s'il s'agit d'un article, d'une expérience, d'une application pratique, d'une thèse, d'un ensemble de données ou d'un autre, faites-le nous savoir et nous vous ajouterons à la section vitrine ou même ici.
Lisez la dernière documentation ici. Les pages notables comprennent:
| Nom | Apprentissage actif | |
|---|---|---|
| Des stratégies de requête | Critères d'arrêt | |
| petit texte v1.3.0 | 14 | 5 |
| petit texte v2.0.0 | 19 | 5 |
Nous utilisons les chiffres uniquement pour montrer à des progrès énormes que le petit texte a réalisés au fil du temps. Il y a de nombreuses fonctionnalités et améliorations qui ne se reflètent pas dans ces chiffres.
Modal, Alipy, Libact, Altoolbox
Les contributions sont les bienvenues. Les détails peuvent être trouvés dans contribution.md.
Ce logiciel a été créé par Christopher Schröder (@chschroeder) au groupe NLP de l'Université de Leipzig qui fait partie du réseau de recherche Web. Le projet englobant a été financé par la Banque de développement de Saxe (SAB) dans le cadre du numéro de projet 100335729.
Le petit texte a été introduit en détail dans le papier de démonstration du système EACL23 "Small-Text: Apprentissage actif pour la classification du texte en python" qui peut être cité comme suit:
@inproceedings{schroeder2023small-text,
title = "Small-Text: Active Learning for Text Classification in Python",
author = {Schr{"o}der, Christopher and M{"u}ller, Lydia and Niekler, Andreas and Potthast, Martin},
booktitle = "Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: System Demonstrations",
month = may,
year = "2023",
address = "Dubrovnik, Croatia",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2023.eacl-demo.11",
pages = "84--95"
}
Licence MIT