
Aprendizaje activo para la clasificación de texto en Python.
Instalación | Inicio rápido | Contribución | ChangeLog | Documento
Small-Text proporciona un aprendizaje activo de última generación para la clasificación de texto. Se proporcionan varias estrategias de consulta preimplementadas, estrategias de inicialización y criterios de detención, que pueden mezclarse y combinarse fácilmente para construir experimentos o aplicaciones de aprendizaje activo.
Active Learning le permite etiquetar eficientemente los datos de entrenamiento para el aprendizaje supervisado en un escenario en el que tiene pocos o ningún datos etiquetados.
Versión 2.0.0 Dev1 (v2.0.0.dev1) - 24 de noviembre de 2024
Versión 1.4.1 (V1.4.1) - 18 de agosto de 2024
Versión 1.4.0 (V1.4.0) - 9 de junio de 2024
¿Documento publicado en EACL 2023?
Para obtener una lista completa de cambios, consulte el registro de cambios.
El texto pequeño se puede instalar fácilmente a través de PIP:
pip install small-text El comando da como resultado una instalación delgada con solo las dependencias necesarias. Para una instalación completa a través de PIP, solo necesita incluir el requisito adicional transformers :
pip install small-text[transformers]La biblioteca requiere Python 3.8 o más nueva. Para usar la GPU, se requiere CUDA 10.1 o más nuevo. Se puede encontrar más información sobre la instalación en la documentación.
Para un inicio rápido, consulte los ejemplos proporcionados para la clasificación binaria, la clasificación de múltiples clases de Pytorch y la clasificación de clase múltiple basada en transformadores, o consulte los cuadernos.
| # | Computadora portátil | |
|---|---|---|
| 1 | Introducción: aprendizaje activo para la clasificación de texto con texto pequeño | |
| 2 | Usar criterios de detención para el aprendizaje activo | |
| 3 | Aprendizaje activo usando setfit | |
| 4 | Usando las capacidades de disparo cero de SetFit para la inicialización de arranque en frío |
Se puede encontrar una lista completa de exhibiciones en los documentos.
? ¿Le gustaría compartir su caso de uso? Independientemente de si se trata de un documento, un experimento, una aplicación práctica, una tesis, un conjunto de datos u otro, háganoslo saber y lo agregaremos a la sección de exhibición o incluso aquí.
Lea la última documentación aquí. Las páginas notables incluyen:
| Nombre | Aprendizaje activo | |
|---|---|---|
| Estrategias de consulta | Criterios de detención | |
| Texto pequeño V1.3.0 | 14 | 5 |
| Texto pequeño v2.0.0 | 19 | 5 |
Usamos los números solo para mostrar en un progreso tremendo que el texto pequeño ha hecho con el tiempo. Hay muchas características y mejoras que no se reflejan en estos números.
modal, alipy, libact, altoolbox
Las contribuciones son bienvenidas. Los detalles se pueden encontrar en la contribución.
Este software fue creado por Christopher Schröder (@chschroeder) en el grupo NLP de la Universidad de Leipzig, que forma parte de la red de investigación de Webis. El proyecto que abarca fue financiado por el Banco de Desarrollo de Sajonia (SAB) bajo el número de proyecto 100335729.
Se ha introducido en detalle el texto pequeño en el documento de demostración del sistema EACL23 "Small-Text: Aprendizaje activo para la clasificación de texto en Python" que se puede citar de la siguiente manera:
@inproceedings{schroeder2023small-text,
title = "Small-Text: Active Learning for Text Classification in Python",
author = {Schr{"o}der, Christopher and M{"u}ller, Lydia and Niekler, Andreas and Potthast, Martin},
booktitle = "Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: System Demonstrations",
month = may,
year = "2023",
address = "Dubrovnik, Croatia",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2023.eacl-demo.11",
pages = "84--95"
}
Licencia de MIT