evalkit
1.0.0
Typescript LLM评估库
Evalkit是一个开源库,专为打字稿开发人员而旨在评估和改善大语模型(LLMS)的性能。确保您的AI模型可靠,准确和值得信赖。
单击此处导航到官方的撤离文档
在文档中,您可以找到有关如何使用Evalkit,其体系结构的信息,包括各种用例和LLM提供商的教程和食谱。
| 特征 | 可用性 | 文档 |
|---|---|---|
| 偏置检测度量 | ✅ | ? |
| 相干度量 | ✅ | ? |
| 动态度量(G-eval) | ✅ | ? |
| 忠诚度量 | ✅ | ? |
| 幻觉指标 | ✅ | ? |
| 意图检测度量 | ✅ | ? |
| 语义相似性度量 | ✅ | ? |
| 语义相似性度量 | ✅ | ? |
| 报告 | ? | ? |
寻找这里未列出的度量/功能?打开一个问题,让我们知道!
evalkit当前出口一个核心软件包,其中包括所有相关功能。通过运行以下命令安装软件包:
npm install --save-dev @evalkit/core我们欢迎社区的捐款!请随时提交拉动请求或为错误或功能建议创建问题。
该存储库的源代码可在Apache 2.0许可下获得。