SanskritShala
1.0.0
该论文的官方代码“ Sanskritshala:具有基于Web的界面的神经梵语NLP工具包,用于教学和注释目的”。如果您使用此代码,请引用我们的论文。
您可以与我们的梵语基于网络的平台进行互动: Link 。我们鼓励您检查我们的演示视频以熟悉我们的平台。
您可能会在Neural Modules文件夹中找到有关文字segementaion,形态标记,Depedency解析和复合类型标识任务的更多详细信息。
首先,您需要按照上一节中的指示在计算机上安装单个模块。您无需在ODER中使用GPU就可以使这些验证的系统在本地机器上工作。您可能会找到有关如何在SanShala-Web文件夹中本地计算机上部署工具包的更多详细信息。
Saneval是用于评估梵语嵌入质量的工具包。我们通过将它们用作广泛而多样的任务的功能来评估它们的概括能力。我们包括一个由4个固有任务组成的套件,这些任务评估在单词嵌入中编码哪些语言特性。我们的目标是简化梵语的研究和开发通用固定尺寸的单词表示。您可能会在EvalSan文件夹中找到更多代码库的详细信息。
SLP1音译方案用于我们的数据。您可以使用此代码将其更改为另一个方案。| 任务 | 公制 | #dev | #测试 |
|---|---|---|---|
| 相关性 | F-SCORE | 4.5k | 9k |
| 相似 | 准确性 | na | 3k |
| 分类句法 | 纯度 | na | 1.1k |
| 分类语义 | 纯度 | na | 150 |
| 类比句法 | 准确性 | na | 10k |
| 类比语义 | 准确性 | na | 6.4k |
README.md 。models文件夹放在父目录路径中。EvalSan/evaluations/Intrinsic/路径中。该向量用于评估脚本。EvalSan/LCM文件夹中获得。有关更多详细信息,请访问此链接。 如果您使用我们的工具,如果您引用我们的论文,我们将不胜感激:
@misc{Sandhan_SanskritShala,
doi = {10.48550/ARXIV.2302.09527},
url = {https://arxiv.org/abs/2302.09527},
author = {Sandhan, Jivnesh and Agarwal, Anshul and Behera, Laxmidhar and Sandhan, Tushar and Goyal, Pawan},
keywords = {Computation and Language (cs.CL), FOS: Computer and information sciences, FOS: Computer and information sciences},
title = {SanskritShala: A Neural Sanskrit NLP Toolkit with Web-Based Interface for Pedagogical and Annotation Purposes},
publisher = {arXiv},
year = {2023},
copyright = {Creative Commons Attribution 4.0 International}
}
该项目是根据Apache license 2.0条款获得许可的。
我们要感谢所有帮助我们为Sanskritshala制作不同神经模型的人。