
在Python中进行文本分类的积极学习。
安装|快速启动|贡献| ChangElog |文档
小文本为文本分类提供了最新的主动学习。提供了几种预先实施的查询策略,初始化策略和停止标准,可以轻松混合并匹配以构建主动的学习实验或应用程序。
主动学习使您可以在几乎没有标记的数据的情况下有效地标记培训数据,以进行监督学习。
版本2.0.0 dev1 (v2.0.0.dev1) - 2024年11月24日
版本1.4.1 (v1.4.1) - 2024年8月18日
版本1.4.0 (v1.4.0) - 2024年6月9日
论文在EACL 2023上发表?
有关更改的完整列表,请参见更改日志。
小文本可以通过PIP轻松安装:
pip install small-text该命令仅具有必要的依赖项而导致纤细的安装。对于通过PIP进行完整安装,您只需要包括transformers额外的要求:
pip install small-text[transformers]图书馆需要Python 3.8或更新。对于使用GPU,需要CUDA 10.1或更新。有关安装的更多信息,请参见文档中。
要快速启动,请参见提供的二进制分类,Pytorch多类分类和基于变压器的多级分类的示例,或检查笔记本电脑。
| # | 笔记本 | |
|---|---|---|
| 1 | 介绍:通过小文本进行文本分类的积极学习 | |
| 2 | 使用停止标准进行积极学习 | |
| 3 | 使用setFit积极学习 | |
| 4 | 使用setFit的零射击功能进行冷启动初始化 |
可以在文档中找到完整的展示箱列表。
?您想分享您的用例吗?无论是论文,实验,实际应用,论文,数据集还是其他,请告诉我们,我们将您添加到“展示”部分,甚至在此处。
在此处阅读最新文档。值得注意的页面包括:
| 姓名 | 积极学习 | |
|---|---|---|
| 查询策略 | 停止标准 | |
| 小文本v1.3.0 | 14 | 5 |
| 小文本v2.0.0 | 19 | 5 |
我们只使用这些数字来表明小文本随着时间的推移取得的巨大进步。这些数字没有反映出许多功能和改进。
模态,艾比利,libact,altoolbox
欢迎捐款。详细信息可以在贡献中找到。
该软件是由莱比锡大学NLP组的ChristopherSchröder(@chschroeder)创建的,该小组是Webis Research Network的一部分。该项目由萨克森(SAB)开发银行(SAB)资助,根据项目编号10035729。
在EACL23系统演示论文中详细介绍了小文本“小文本:python中文本分类的主动学习”,可引用如下:
@inproceedings{schroeder2023small-text,
title = "Small-Text: Active Learning for Text Classification in Python",
author = {Schr{"o}der, Christopher and M{"u}ller, Lydia and Niekler, Andreas and Potthast, Martin},
booktitle = "Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: System Demonstrations",
month = may,
year = "2023",
address = "Dubrovnik, Croatia",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2023.eacl-demo.11",
pages = "84--95"
}
麻省理工学院许可证