
การเรียนรู้ที่ใช้งานอยู่สำหรับการจำแนกประเภทข้อความใน Python
การติดตั้ง เริ่มต้นอย่างรวดเร็ว | ผลงาน | Changelog | เอกสาร
ข้อความเล็ก ๆ ให้ การเรียนรู้ที่ทันสมัย สำหรับการจำแนกประเภทข้อความ กลยุทธ์การสืบค้นล่วงหน้าหลายครั้งกลยุทธ์การกำหนดค่าเริ่มต้นและการหยุดเกณฑ์มีให้ซึ่งสามารถผสมและจับคู่ได้อย่างง่ายดายเพื่อสร้างการทดลองหรือแอปพลิเคชันการเรียนรู้ที่ใช้งานอยู่
การเรียนรู้ที่ใช้งานช่วยให้คุณสามารถติดฉลากข้อมูลการฝึกอบรมสำหรับการเรียนรู้ภายใต้การดูแลในสถานการณ์ที่คุณมีข้อมูลที่มีป้ายกำกับเพียงเล็กน้อย
เวอร์ชัน 2.0.0 dev1 (v2.0.0.dev1) - 24 พฤศจิกายน 2567
เวอร์ชัน 1.4.1 (v1.4.1) - 18 สิงหาคม 2024
เวอร์ชัน 1.4.0 (v1.4.0) - 9 มิถุนายน 2024
กระดาษตีพิมพ์ที่ EACL 2023?
สำหรับรายการการเปลี่ยนแปลงที่สมบูรณ์ให้ดูบันทึกการเปลี่ยนแปลง
ข้อความขนาดเล็กสามารถติดตั้งได้อย่างง่ายดายผ่าน PIP:
pip install small-text คำสั่งส่งผลในการติดตั้งแบบเพรียวบางด้วยการพึ่งพาที่จำเป็นเท่านั้น สำหรับการติดตั้งเต็มรูปแบบผ่าน PIP คุณเพียงแค่ต้องรวมข้อกำหนดพิเศษ transformers :
pip install small-text[transformers]ห้องสมุดต้องใช้ Python 3.8 หรือใหม่กว่า สำหรับการใช้ GPU, CUDA 10.1 หรือใหม่กว่านั้นเป็นสิ่งจำเป็น ข้อมูลเพิ่มเติมเกี่ยวกับการติดตั้งสามารถพบได้ในเอกสาร
สำหรับการเริ่มต้นอย่างรวดเร็วให้ดูตัวอย่างที่ให้ไว้สำหรับการจำแนกประเภทไบนารีการจำแนกประเภทหลายชั้นของ Pytorch และการจำแนกประเภทหลายคลาสที่ใช้หม้อแปลงหรือตรวจสอบสมุดบันทึก
| - | สมุดบันทึก | |
|---|---|---|
| 1 | อินโทร: การเรียนรู้ที่ใช้งานอยู่สำหรับการจำแนกข้อความด้วยข้อความเล็ก ๆ | |
| 2 | การใช้เกณฑ์การหยุดสำหรับการเรียนรู้ที่ใช้งานอยู่ | |
| 3 | การเรียนรู้ที่ใช้งานอยู่โดยใช้ setFit | |
| 4 | การใช้ความสามารถในการยิงศูนย์ของ SetFit สำหรับการเริ่มต้นเริ่มต้นเย็น |
รายการทั้งหมดของการจัดแสดงสามารถพบได้ในเอกสาร
- คุณต้องการแบ่งปันกรณีการใช้งานของคุณหรือไม่? ไม่ว่าจะเป็นกระดาษ, การทดลอง, แอปพลิเคชันที่ใช้งานได้จริง, วิทยานิพนธ์, ชุดข้อมูลหรืออื่น ๆ แจ้งให้เราทราบและเราจะเพิ่มคุณในส่วนแสดงหรือแม้แต่ที่นี่
อ่านเอกสารล่าสุดที่นี่ หน้าสำคัญรวมถึง:
| ชื่อ | การเรียนรู้อย่างแข็งขัน | |
|---|---|---|
| กลยุทธ์การสอบถาม | เกณฑ์การหยุด | |
| ข้อความขนาดเล็ก v1.3.0 | 14 | 5 |
| ข้อความขนาดเล็ก v2.0.0 | 19 | 5 |
เราใช้ตัวเลขเพียงเพื่อแสดงให้เห็นถึงความคืบหน้าอย่างมากที่ข้อความเล็ก ๆ ได้ทำเมื่อเวลาผ่านไป มีคุณสมบัติและการปรับปรุงมากมายที่ไม่ได้สะท้อนในตัวเลขเหล่านี้
Modal, Alipy, Libact, Altoolbox
ยินดีต้อนรับการมีส่วนร่วม รายละเอียดสามารถพบได้ในการสนับสนุน
ซอฟต์แวร์นี้ถูกสร้างขึ้นโดย Christopher Schröder (@chschroeder) ที่กลุ่ม NLP ของ Leipzig University ซึ่งเป็นส่วนหนึ่งของเครือข่ายการวิจัย Webis โครงการที่ครอบคลุมได้รับทุนจากธนาคารเพื่อการพัฒนาแห่งแซกโซนี (SAB) ภายใต้หมายเลขโครงการ 100335729
ข้อความขนาดเล็กได้รับการแนะนำในรายละเอียดในกระดาษสาธิตระบบ EACL23 "ข้อความเล็ก ๆ : การเรียนรู้ที่ใช้งานอยู่สำหรับการจำแนกประเภทข้อความใน Python" ซึ่งสามารถอ้างถึงได้ดังนี้:
@inproceedings{schroeder2023small-text,
title = "Small-Text: Active Learning for Text Classification in Python",
author = {Schr{"o}der, Christopher and M{"u}ller, Lydia and Niekler, Andreas and Potthast, Martin},
booktitle = "Proceedings of the 17th Conference of the European Chapter of the Association for Computational Linguistics: System Demonstrations",
month = may,
year = "2023",
address = "Dubrovnik, Croatia",
publisher = "Association for Computational Linguistics",
url = "https://aclanthology.org/2023.eacl-demo.11",
pages = "84--95"
}
ใบอนุญาต MIT