
Активное обучение для классификации текста в Python.
Установка | Быстрый старт | Вклад | Изменение | Док
Small-Text обеспечивает современное активное обучение для классификации текста. Представлены несколько предварительно внедренных стратегий запросов, стратегии инициализации и остановки критур, которые могут быть легко смешаны и сопоставлены для создания экспериментов или применений активного обучения.
Активное обучение позволяет вам эффективно маркировать данные обучения для контролируемого обучения в сценарии, в котором у вас практически нет помеченных данных.
Версия 2.0.0 dev1 (v2.0.0.dev1) - 24 ноября 2024 г.
Версия 1.4.1 (v1.4.1) - 18 августа, 2024 г.
Версия 1.4.0 (v1.4.0) - 9 июня 2024 г.
Бумага, опубликованная в EACL 2023?
Полный список изменений см. В журнале изменения.
Небольшой текст может быть легко установлен через PIP:
pip install small-text Команда приводит к тонкой установке только с необходимыми зависимостями. Для полной установки через PIP вам просто нужно включить дополнительные требования transformers :
pip install small-text[transformers]Библиотека требует Python 3.8 или новее. Для использования графического процессора требуется CUDA 10.1 или новее. Более подробную информацию о установке можно найти в документации.
Для быстрого начала см. Приведенные примеры для бинарной классификации, многоклассную классификацию Pytorch и многоклассную классификацию на основе трансформатора или проверьте записные книжки.
| # | Блокнот | |
|---|---|---|
| 1 | Intro: активное обучение для классификации текста с небольшим текстом | |
| 2 | Использование критериев остановки для активного обучения | |
| 3 | Активное обучение с использованием setfit | |
| 4 | Использование возможностей с нулевым выстрелом SetFit для инициализации холодного запуска |
Полный список витрин можно найти в документах.
? Хотели бы вы поделиться вашим вариантом использования? Независимо от того, есть ли это статья, эксперимент, практическое применение, тезис, набор данных или другой, сообщите нам, и мы добавим вас в раздел витрины или даже здесь.
Прочитайте последнюю документацию здесь. Примечательные страницы включают в себя:
| Имя | Активное обучение | |
|---|---|---|
| Стратегии запроса | Критерии остановки | |
| Маленький текст V1.3.0 | 14 | 5 |
| Маленький текст v2.0.0 | 19 | 5 |
Мы используем цифры только для того, чтобы показать огромному прогрессу, который сделал маленький текст со временем. Есть много функций и улучшений, которые не отражаются в этих числах.
Модальный, Алип, Либакт, Алтулбокс
Взносы приветствуются. Подробности можно найти в соревнованиях.
Это программное обеспечение было создано Кристофером Шредером (@chschroeder) в группе NLP Университета Лейпцига, которая является частью сети исследований Webis. Объединенный проект финансировался Банком развития Саксонии (SAB) в соответствии с проектом № 100335729.
Маленький текст был подробно введен в демонстрационной статье системы EACL23 «Маленький текст: активное обучение для классификации текста в Python», которое можно цитировать следующим образом:
@inproceedings{schroeder2023small-text,
title = "Small-Text: Active Learning for Text Classification in Python",
author = {Schr{"o}der, Christopher and M{"u}ller, Lydia and Niekler, Andreas and Potthast, Martin},
booktitle = "Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: System Demonstrations",
month = may,
year = "2023",
address = "Dubrovnik, Croatia",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2023.eacl-demo.11",
pages = "84--95"
}
MIT Лицензия