
Aprendizagem ativa para classificação de texto em Python.
Instalação | Iniciar rápido | Contribuição | Changelog | Documentos
O texto pequeno fornece aprendizado ativo de ponta para classificação de texto. São fornecidas várias estratégias de consulta pré-implementadas, estratégias de inicialização e critérios de parada, que podem ser facilmente misturados e combinados para criar experimentos ou aplicações de aprendizado ativo.
O aprendizado ativo permite rotular com eficiência dados de treinamento para aprendizado supervisionado em um cenário em que você tem pouco ou nenhum dados rotulado.
Versão 2.0.0 dev1 (v2.0.0.dev1) - 24 de novembro de 2024
Versão 1.4.1 (v1.4.1) - 18 de agosto de 2024
Versão 1.4.0 (v1.4.0) - 9 de junho de 2024
Artigo publicado no EACL 2023?
Para uma lista completa de alterações, consulte o log de alterações.
Pequeno texto pode ser facilmente instalado via PIP:
pip install small-text O comando resulta em uma instalação fina com apenas as dependências necessárias. Para uma instalação completa via PIP, você só precisa incluir o requisito extra transformers :
pip install small-text[transformers]A biblioteca requer Python 3.8 ou mais recente. Para usar a GPU, é necessário CUDA 10.1 ou mais recente. Mais informações sobre a instalação podem ser encontradas na documentação.
Para um início rápido, consulte os exemplos fornecidos para classificação binária, classificação de multi-classe Pytorch e classificação de várias classes baseada em transformador ou confira os notebooks.
| # | Caderno | |
|---|---|---|
| 1 | Introdução: aprendizado ativo para classificação de texto com texto pequeno | |
| 2 | Usando critérios de parada para aprendizado ativo | |
| 3 | Aprendizado ativo usando setfit | |
| 4 | Usando os recursos de tiro zero do Setfit para inicialização de início frio |
Uma lista completa de exibições pode ser encontrada nos documentos.
? Você gostaria de compartilhar seu caso de uso? Independentemente de ser um artigo, um experimento, uma aplicação prática, uma tese, um conjunto de dados ou outro, informe -nos e o adicionaremos à seção Showcase ou mesmo aqui.
Leia a documentação mais recente aqui. Páginas dignas de nota incluem:
| Nome | Aprendizado ativo | |
|---|---|---|
| Estratégias de consulta | Parada de critérios | |
| Pequeno texto v1.3.0 | 14 | 5 |
| Texto pequeno v2.0.0 | 19 | 5 |
Usamos os números apenas para mostrar um tremendo progresso que o texto pequeno fez com o tempo. Existem muitos recursos e melhorias que não se refletem nesses números.
Modal, Alipy, Libact, Altoolbox
Contribuições são bem -vindas. Os detalhes podem ser encontrados em contribuindo.md.
Este software foi criado por Christopher Schröder (@chschroeder) no grupo NLP da Universidade de Leipzig, que faz parte da rede de pesquisa da Webis. O projeto abrangente foi financiado pelo Banco de Desenvolvimento da Saxônia (SAB) sob o projeto número 100335729.
O texto pequeno foi introduzido em detalhes no artigo de demonstração do sistema EACL23 "Texto pequeno: aprendizado ativo para classificação de texto em python", que pode ser citado da seguinte maneira:
@inproceedings{schroeder2023small-text,
title = "Small-Text: Active Learning for Text Classification in Python",
author = {Schr{"o}der, Christopher and M{"u}ller, Lydia and Niekler, Andreas and Potthast, Martin},
booktitle = "Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: System Demonstrations",
month = may,
year = "2023",
address = "Dubrovnik, Croatia",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2023.eacl-demo.11",
pages = "84--95"
}
MIT Licença