
파이썬에서 텍스트 분류를위한 적극적인 학습.
설치 | 빠른 시작 | 기여 | changelog | 문서
Small-Text는 텍스트 분류를위한 최첨단 적극적인 학습을 제공합니다. 몇 가지 사전 구축 된 쿼리 전략, 초기화 전략 및 정지 기준이 제공되며, 이는 적극적인 학습 실험 또는 응용 프로그램을 구축하기 위해 쉽게 혼합 및 일치시킬 수 있습니다.
Active Learning을 사용하면 데이터 라벨이 거의 없거나 전혀없는 시나리오에서 감독 학습을위한 교육 데이터를 효율적으로 레이블을 지정할 수 있습니다.
버전 2.0.0 Dev1 (v2.0.0.dev1) -2024 년 11 월 24 일
버전 1.4.1 (v1.4.1) - 2024 년 8 월 18 일
버전 1.4.0 (v1.4.0) -2024 년 6 월 9 일
EACL 2023에 출판 된 논문?
변경의 전체 목록은 변경 로그를 참조하십시오.
Small-Text는 PIP를 통해 쉽게 설치할 수 있습니다.
pip install small-text 명령은 필요한 종속성만으로 슬림 한 설치를 초래합니다. PIP를 통해 전체 설치하려면 transformers 추가 요구 사항 만 포함하면됩니다.
pip install small-text[transformers]라이브러리에는 Python 3.8 또는 새롭게 필요합니다. GPU를 사용하려면 Cuda 10.1 또는 최신이 필요합니다. 설치에 대한 자세한 내용은 설명서에서 찾을 수 있습니다.
빠른 시작은 이진 분류, Pytorch 멀티 클래스 분류 및 변압기 기반 멀티 클래스 분류에 제공된 예제를 참조하거나 노트북을 확인하십시오.
| 틀 | 공책 | |
|---|---|---|
| 1 | 소개 : 소형 텍스트로 텍스트 분류를위한 적극적인 학습 | |
| 2 | 적극적인 학습을위한 중지 기준 사용 | |
| 3 | setfit을 사용한 적극적인 학습 | |
| 4 | 콜드 스타트 초기화를 위해 SetFit의 제로 샷 기능을 사용합니다 |
쇼케이스의 전체 목록은 문서에서 찾을 수 있습니다.
? 사용 사례를 공유 하시겠습니까? 논문, 실험, 실용적인 응용 프로그램, 논문, 데이터 세트 또는 기타라면 알려 주시면 쇼케이스 섹션 또는 여기에 추가하겠습니다.
여기에서 최신 문서를 읽으십시오. 주목할만한 페이지에는 다음이 포함됩니다.
| 이름 | 적극적인 학습 | |
|---|---|---|
| 쿼리 전략 | 중지 기준 | |
| 작은 텍스트 v1.3.0 | 14 | 5 |
| 작은 텍스트 v2.0.0 | 19 | 5 |
우리는 숫자를 사용하여 소규모 텍스트가 시간이 지남에 따라 발생한 엄청난 발전을 보여줍니다. 이 숫자에 반영되지 않은 많은 기능과 개선이 있습니다.
Modal, Alipy, Libact, Altoolbox
기부금을 환영합니다. 자세한 내용은 Contributing.md에서 찾을 수 있습니다.
이 소프트웨어는 Webis Research Network의 일부인 Leipzig University의 NLP 그룹에서 Christopher Schröder (@chschroeder)에 의해 만들어졌습니다. Encorporsing Project는 프로젝트 번호 100335729에 따라 SAXONY 개발 은행 (SAB)이 자금을 지원했습니다.
Small-Text는 EACL23 시스템 데모 용지 "Small-Text : Python의 텍스트 분류를위한 능동 학습"에 자세히 소개되었습니다.
@inproceedings{schroeder2023small-text,
title = "Small-Text: Active Learning for Text Classification in Python",
author = {Schr{"o}der, Christopher and M{"u}ller, Lydia and Niekler, Andreas and Potthast, Martin},
booktitle = "Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: System Demonstrations",
month = may,
year = "2023",
address = "Dubrovnik, Croatia",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2023.eacl-demo.11",
pages = "84--95"
}
MIT 라이센스