evalkit
1.0.0
Typescript LLM評估庫
Evalkit是一個開源庫,專為打字稿開發人員而旨在評估和改善大語模型(LLMS)的性能。確保您的AI模型可靠,準確和值得信賴。
單擊此處導航到官方的撤離文檔
在文檔中,您可以找到有關如何使用Evalkit,其體系結構的信息,包括各種用例和LLM提供商的教程和食譜。
| 特徵 | 可用性 | 文件 |
|---|---|---|
| 偏置檢測度量 | ✅ | ? |
| 相干度量 | ✅ | ? |
| 動態度量(G-eval) | ✅ | ? |
| 忠誠度量 | ✅ | ? |
| 幻覺指標 | ✅ | ? |
| 意圖檢測度量 | ✅ | ? |
| 語義相似性度量 | ✅ | ? |
| 語義相似性度量 | ✅ | ? |
| 報告 | ? | ? |
尋找這裡未列出的度量/功能?打開一個問題,讓我們知道!
evalkit當前出口一個核心軟件包,其中包括所有相關功能。通過運行以下命令安裝軟件包:
npm install --save-dev @evalkit/core我們歡迎社區的捐款!請隨時提交拉動請求或為錯誤或功能建議創建問題。
該存儲庫的源代碼可在Apache 2.0許可下獲得。