
在Python中進行文本分類的積極學習。
安裝|快速啟動|貢獻| ChangElog |文檔
小文本為文本分類提供了最新的主動學習。提供了幾種預先實施的查詢策略,初始化策略和停止標準,可以輕鬆混合併匹配以構建主動的學習實驗或應用程序。
主動學習使您可以在幾乎沒有標記的數據的情況下有效地標記培訓數據,以進行監督學習。
版本2.0.0 dev1 (v2.0.0.dev1) - 2024年11月24日
版本1.4.1 (v1.4.1) - 2024年8月18日
版本1.4.0 (v1.4.0) - 2024年6月9日
論文在EACL 2023上發表?
有關更改的完整列表,請參見更改日誌。
小文本可以通過PIP輕鬆安裝:
pip install small-text該命令僅具有必要的依賴項而導致纖細的安裝。對於通過PIP進行完整安裝,您只需要包括transformers額外的要求:
pip install small-text[transformers]圖書館需要Python 3.8或更新。對於使用GPU,需要CUDA 10.1或更新。有關安裝的更多信息,請參見文檔中。
要快速啟動,請參見提供的二進制分類,Pytorch多類分類和基於變壓器的多級分類的示例,或檢查筆記本電腦。
| # | 筆記本 | |
|---|---|---|
| 1 | 介紹:通過小文本進行文本分類的積極學習 | |
| 2 | 使用停止標准進行積極學習 | |
| 3 | 使用setFit積極學習 | |
| 4 | 使用setFit的零射擊功能進行冷啟動初始化 |
可以在文檔中找到完整的展示箱列表。
?您想分享您的用例嗎?無論是論文,實驗,實際應用,論文,數據集還是其他,請告訴我們,我們將您添加到“展示”部分,甚至在此處。
在此處閱讀最新文檔。值得注意的頁麵包括:
| 姓名 | 積極學習 | |
|---|---|---|
| 查詢策略 | 停止標準 | |
| 小文本v1.3.0 | 14 | 5 |
| 小文本v2.0.0 | 19 | 5 |
我們只使用這些數字來表明小文本隨著時間的推移取得的巨大進步。這些數字沒有反映出許多功能和改進。
模態,艾比利,libact,altoolbox
歡迎捐款。詳細信息可以在貢獻中找到。
該軟件是由萊比錫大學NLP組的ChristopherSchröder(@chschroeder)創建的,該小組是Webis Research Network的一部分。該項目由薩克森(SAB)開發銀行(SAB)資助,根據項目編號10035729。
在EACL23系統演示論文中詳細介紹了小文本“小文本:python中文本分類的主動學習”,可引用如下:
@inproceedings{schroeder2023small-text,
title = "Small-Text: Active Learning for Text Classification in Python",
author = {Schr{"o}der, Christopher and M{"u}ller, Lydia and Niekler, Andreas and Potthast, Martin},
booktitle = "Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: System Demonstrations",
month = may,
year = "2023",
address = "Dubrovnik, Croatia",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2023.eacl-demo.11",
pages = "84--95"
}
麻省理工學院許可證