รหัสอย่างเป็นทางการสำหรับกระดาษ "Sanskritshala: ชุดเครื่องมือ NLP ภาษาสันสกฤต Neural พร้อมอินเทอร์เฟซบนเว็บเพื่อจุดประสงค์ในการสอนและคำอธิบายประกอบ" หากคุณใช้รหัสนี้โปรดอ้างอิงกระดาษของเรา
คุณสามารถโต้ตอบกับแพลตฟอร์มบนเว็บของ Sanskritshala: Link เราขอแนะนำให้คุณตรวจสอบวิดีโอสาธิตของเราเพื่อทำความคุ้นเคยกับแพลตฟอร์มของเรา
คุณอาจพบรายละเอียดเพิ่มเติมของรหัสฐานในโฟลเดอร์ Neural Modules สำหรับการแยกคำว่าการติดแท็กทางสัณฐานวิทยาการแยกวิเคราะห์ depedency และงานการระบุประเภทสารประกอบ
ก่อนอื่นคุณต้องติดตั้งแต่ละโมดูลบนเครื่องของคุณตามคำแนะนำในส่วนด้านบน คุณไม่จำเป็นต้องมี GPU ใน Oder เพื่อให้ระบบที่ผ่านการฝึกอบรมเหล่านี้ทำงานบนเครื่องในท้องถิ่นของคุณ คุณอาจพบรายละเอียดเพิ่มเติมเกี่ยวกับวิธีการปรับใช้ชุดเครื่องมือบนเครื่องในเครื่องของคุณในโฟลเดอร์ SanShala-Web
Saneval เป็นชุดเครื่องมือสำหรับการประเมินคุณภาพของการฝังภาษาสันสกฤต เราประเมินพลังการวางนัยทั่วไปของพวกเขาโดยใช้พวกเขาเป็นคุณสมบัติในชุดงานที่กว้างและหลากหลาย เรารวมชุดของ 4 งานที่แท้จริง ซึ่งประเมินเกี่ยวกับคุณสมบัติทางภาษาที่เข้ารหัสในการฝังคำ เป้าหมายของเราคือการผ่อนคลายการศึกษาและการพัฒนาการเป็นตัวแทนคำขนาดคงที่ขนาดคงที่สำหรับภาษาสันสกฤต คุณอาจพบรายละเอียดเพิ่มเติมของรหัสฐานในโฟลเดอร์ EvalSan
SLP1 รูปแบบการถอดรหัสสำหรับข้อมูลของเรา คุณสามารถเปลี่ยนเป็นโครงการอื่นโดยใช้รหัสนี้| งาน | ตัวชี้วัด | #DEV | #ทดสอบ |
|---|---|---|---|
| ความเกี่ยวข้อง | คะแนน F | 4.5k | 9K |
| ความคล้ายคลึงกัน | ความแม่นยำ | นา | 3K |
| การจัดหมวดหมู่วากยสัมพันธ์ | ความบริสุทธิ์ | นา | 1.1k |
| การจัดหมวดหมู่ความหมาย | ความบริสุทธิ์ | นา | 150 |
| การเปรียบเทียบทางวากยสัมพันธ์ | ความแม่นยำ | นา | 10k |
| เปรียบเทียบความหมาย | ความแม่นยำ | นา | 6.4K |
README.md มอบให้สำหรับแต่ละรุ่นmodels ในเส้นทางไดเรกทอรีหลักEvalSan/evaluations/Intrinsic/ Path เวกเตอร์นี้ใช้ในสคริปต์การประเมินผลEvalSan/LCM สำหรับรายละเอียดเพิ่มเติมกรุณาเยี่ยมชมลิงค์นี้ หากคุณใช้เครื่องมือของเราเราจะขอบคุณถ้าคุณอ้างอิงกระดาษของเรา:
@misc{Sandhan_SanskritShala,
doi = {10.48550/ARXIV.2302.09527},
url = {https://arxiv.org/abs/2302.09527},
author = {Sandhan, Jivnesh and Agarwal, Anshul and Behera, Laxmidhar and Sandhan, Tushar and Goyal, Pawan},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {SanskritShala: A Neural Sanskrit NLP Toolkit with Web-Based Interface for Pedagogical and Annotation Purposes},
publisher = {arXiv},
year = {2023},
copyright = {Creative Commons Attribution 4.0 International}
}
โครงการนี้ได้รับใบอนุญาตภายใต้ข้อกำหนดของ Apache license 2.0
เราอยากจะขอบคุณทุกคนที่ช่วยเราสร้างแบบจำลองระบบประสาทที่แตกต่างกันสำหรับภาษาสันสกฤต