
Pembelajaran aktif untuk klasifikasi teks dalam Python.
Instalasi | Mulai Cepat | Kontribusi | Changelog | Dokumen
Teks kecil menyediakan pembelajaran aktif yang canggih untuk klasifikasi teks. Beberapa strategi kueri yang telah diterapkan sebelumnya, strategi inisialisasi, dan penghentian kriteria disediakan, yang dapat dengan mudah dicampur dan dicocokkan untuk membangun eksperimen atau aplikasi pembelajaran aktif.
Pembelajaran aktif memungkinkan Anda untuk secara efisien memberi label data pelatihan untuk pembelajaran yang diawasi dalam skenario di mana Anda memiliki sedikit atau tidak ada data berlabel.
Versi 2.0.0 Dev1 (v2.0.0.dev1) - 24 November, 2024
Versi 1.4.1 (v1.4.1) - 18 Agustus 2024
Versi 1.4.0 (v1.4.0) - 9 Juni, 2024
Makalah yang diterbitkan di EACL 2023?
Untuk daftar perubahan lengkap, lihat log perubahan.
Teks kecil dapat dengan mudah diinstal melalui PIP:
pip install small-text Perintah menghasilkan instalasi ramping dengan hanya dependensi yang diperlukan. Untuk instalasi penuh melalui PIP, Anda hanya perlu menyertakan Persyaratan Ekstra transformers :
pip install small-text[transformers]Perpustakaan membutuhkan Python 3.8 atau yang lebih baru. Untuk menggunakan GPU, CUDA 10.1 atau yang lebih baru diperlukan. Informasi lebih lanjut mengenai instalasi dapat ditemukan dalam dokumentasi.
Untuk awal yang cepat, lihat contoh yang disediakan untuk klasifikasi biner, klasifikasi multi-kelas Pytorch, dan klasifikasi multi-kelas berbasis transformator, atau periksa notebook.
| # | Buku catatan | |
|---|---|---|
| 1 | Intro: Pembelajaran aktif untuk klasifikasi teks dengan teks kecil | |
| 2 | Menggunakan kriteria penghentian untuk pembelajaran aktif | |
| 3 | Pembelajaran Aktif Menggunakan SetFit | |
| 4 | Menggunakan Kemampuan Tembakan Zero SetFit untuk Inisialisasi Mulai Dingin |
Daftar lengkap showcases dapat ditemukan di dokumen.
? Apakah Anda ingin membagikan kasus penggunaan Anda? Terlepas dari apakah itu adalah makalah, percobaan, aplikasi praktis, tesis, dataset, atau lainnya, beri tahu kami dan kami akan menambahkan Anda ke bagian showcase atau bahkan di sini.
Baca dokumentasi terbaru di sini. Halaman penting meliputi:
| Nama | Giat belajar | |
|---|---|---|
| Strategi kueri | Menghentikan kriteria | |
| V1.3.0 teks kecil | 14 | 5 |
| V2.0.0 teks kecil | 19 | 5 |
Kami menggunakan angka hanya untuk menunjukkan kemajuan luar biasa yang dibuat oleh teks kecil dari waktu ke waktu. Ada banyak fitur dan peningkatan yang tidak tercermin dalam angka -angka ini.
Modal, Alipy, Libact, Altoolbox
Kontribusi dipersilakan. Detail dapat ditemukan di Contributing.md.
Perangkat lunak ini dibuat oleh Christopher Schröder (@chschroeder) di kelompok NLP Universitas Leipzig yang merupakan bagian dari jaringan penelitian Webis. Proyek yang meliputi ini didanai oleh Bank Pembangunan Saxony (SAB) di bawah nomor proyek 100335729.
Teks kecil telah diperkenalkan secara rinci dalam kertas demonstrasi sistem EACL23 "teks kecil: pembelajaran aktif untuk klasifikasi teks dalam python" yang dapat dikutip sebagai berikut:
@inproceedings{schroeder2023small-text,
title = "Small-Text: Active Learning for Text Classification in Python",
author = {Schr{"o}der, Christopher and M{"u}ller, Lydia and Niekler, Andreas and Potthast, Martin},
booktitle = "Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: System Demonstrations",
month = may,
year = "2023",
address = "Dubrovnik, Croatia",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2023.eacl-demo.11",
pages = "84--95"
}
Lisensi MIT