
Aktives Lernen für die Textklassifizierung in Python.
Installation | Schneller Start | Beitrag | ChangeLog | Dokumente
Small-Text bietet hochmodernes aktives Lernen für die Textklassifizierung. Es werden mehrere vorgefertigte Abfragestrategien, Initialisierungsstrategien und Stoppkriterien bereitgestellt, die leicht gemischt und zum Aufbau aktiver Lernversuche oder -Anwendungen abgestimmt werden können.
Active Learning ermöglicht es Ihnen, Trainingsdaten für überwachtes Lernen effizient zu kennzeichnen, in einem Szenario, in dem Sie nur wenig bis gar keine beschrifteten Daten haben.
Version 2.0.0 Dev1 (v2.0.0.dev1) - 24. November, 2024
Version 1.4.1 (v1.4.1) - 18. August, 2024
Version 1.4.0 (v1.4.0) - 9. Juni 2024
Veröffentlichung bei EACL 2023?
Eine vollständige Liste von Änderungen finden Sie im Änderungsprotokoll.
Small-Text kann einfach über PIP installiert werden:
pip install small-text Der Befehl führt zu einer schlanken Installation mit nur den erforderlichen Abhängigkeiten. Für eine vollständige Installation über PIP müssen Sie nur die zusätzlichen Anforderungen transformers einbeziehen:
pip install small-text[transformers]Die Bibliothek benötigt Python 3.8 oder neuer. Für die Verwendung der GPU ist CUDA 10.1 oder neuer erforderlich. Weitere Informationen zur Installation finden Sie in der Dokumentation.
Für einen kurzen Start finden Sie in den angegebenen Beispielen für die Binärklassifizierung, die Klassifizierung von Pytorch Multi-Class-Klassifizierung und die Klassifizierung mit transformatorbasiertem Multi-Class, oder schauen Sie sich die Notizbücher an.
| # | Notizbuch | |
|---|---|---|
| 1 | Intro: Aktives Lernen für die Textklassifizierung mit kleinem Text | |
| 2 | Verwenden Sie die Beendigung von Kriterien für aktives Lernen | |
| 3 | Aktives Lernen mit SetFit | |
| 4 | Verwenden der Null -Shot -Funktionen von SetFit für die Initialisierung der Kaltstart |
Eine vollständige Liste der Präsentationen finden Sie in den Dokumenten.
? Möchten Sie Ihren Anwendungsfall teilen? Unabhängig davon, ob es sich um ein Papier, ein Experiment, eine praktische Anwendung, eine These, ein Datensatz oder ein anderes handelt, lassen Sie es uns wissen, und wir werden Sie zum Showcase -Abschnitt oder sogar hier hinzufügen.
Lesen Sie hier die neueste Dokumentation. Bemerkenswerte Seiten umfassen:
| Name | Aktives Lernen | |
|---|---|---|
| Abfragestrategien | Kriterien stoppen | |
| kleiner Text v1.3.0 | 14 | 5 |
| kleiner Text v2.0.0 | 19 | 5 |
Wir verwenden die Zahlen nur, um enorme Fortschritte zu zeigen, die der kleine Text im Laufe der Zeit erzielt hat. Es gibt viele Funktionen und Verbesserungen, die sich nicht in diesen Zahlen widerspiegeln.
Modal, Alipie, Libakt, Altoolbox
Beiträge sind willkommen. Details finden Sie im Beitrag.md.
Diese Software wurde von Christopher Schröder (@chschroeder) der NLP Group der Leipzig University erstellt, die Teil des Webis Research Network ist. Das umfassende Projekt wurde von der Development Bank of Saxony (SAB) unter den Projektnummer 100335729 finanziert.
Small-Text wurde im EACL23-Systemdemonstrationspapier "Small-Text: Active Learning for Text Classification in Python" ausführlich eingeführt, das wie folgt zitiert werden kann:
@inproceedings{schroeder2023small-text,
title = "Small-Text: Active Learning for Text Classification in Python",
author = {Schr{"o}der, Christopher and M{"u}ller, Lydia and Niekler, Andreas and Potthast, Martin},
booktitle = "Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: System Demonstrations",
month = may,
year = "2023",
address = "Dubrovnik, Croatia",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2023.eacl-demo.11",
pages = "84--95"
}
MIT -Lizenz