lm evaluation下载lm evaluation源代码下载

中文(简体)

中文(简体) 中文(繁体) 한국어 日本語 English Português Español Русский العربية Indonesia Deutsch Français ภาษาไทย

首页>编程相关>Ai源码

lm evaluation

Ai源码

1.0.0

下载

LM评估测试套件

该回购包含用于运行评估的代码并重现Jurassic-1技术论文的结果（请参阅博客文章），当前支持通过AI21 Studio API和OpenAI的GPT3 API运行任务。

引用

请使用以下Bibtex条目：

 @techreport{J1WhitePaper,
  author = {Lieber, Opher and Sharir, Or and Lenz, Barak and Shoham, Yoav},
  title = {Jurassic-1: Technical Details And Evaluation},
  institution = {AI21 Labs},
  year = 2021,
  month = aug,
}

安装

 git clone https://github.com/AI21Labs/lm-evaluation.git
cd lm-evaluation
pip install -e .

用法

运行评估的输入点是lm_evaluation/run_eval.py，它接收到要运行的任务和模型列表。

模型参数应为“提供商/model_name”的形式，其中提供商可以为“ AI21”或“ OpenAI”，并且模型名称是提供商支持的模型之一。

通过一种API模型运行时，请使用环境变量AI21_STUDIO_API_KEY和OPERAI_API_KEY设置您的API密钥。确保考虑您事先运行的模型的成本和配额限制。

示例：

# Evaluate hellaswag and winogrande on j1-large
python -m lm_evaluation.run_eval --tasks hellaswag winogrande --models ai21/j1-large

# Evaluate all multiple-choice tasks on j1-jumbo
python -m lm_evaluation.run_eval --tasks all_mc --models ai21/j1-jumbo

# Evaluate all docprob tasks on curie and j1-large
python -m lm_evaluation.run_eval --tasks all_docprobs --models ai21/j1-large openai/curie

数据集

目前，该存储库支持了《侏罗纪-1技术论文》中报告的零射击多项选择和文档概率数据集。

多项选择

按照GPT3论文中所述的多项选择数据集的格式，默认报告的评估指标是其中所述的。

除了StoryCloze之外，我们所有格式化的数据集公开可用，并在LM_EVALUATION/TASKS_CONFIG.PY中引用。需要手动下载和格式化StoryCloze，该位置应通过环境变量“ storycloze_test_path”配置。

文档概率

文档概率任务包括来自19个数据源的文档，包括C4和“堆”的数据集。

每个文档都是在句子边界上预先放置的，每个文档每个文档最多1024个GPT代币，以确保所有模型都可以看到相同的输入/上下文，而不论令牌化如何，并支持对限制在1024序列长度的模型的评估。

这19个任务中的每一个都有约4MB的总文本数据。

其他配置

结果文件夹

默认情况下，所有结果都将保存到文件夹“结果”中，并且重新设计相同的任务将加载现有结果。可以使用环境变量lm_evaluation_results_dir更改结果文件夹。

展开

附加信息

版本 1.0.0
类型 Ai源码
更新时间 2025-09-07
大小 13.83KB
来自于 Github

相关应用

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
LM在线表白网页制作PHP源码美化版正式版

2022-11-01

为您推荐

chat.petals.dev

其他源码

1.0.0
GPT Prompt Templates

其他源码

1.0.0
GPTyped

其他源码

GPTyped 1.0.5
ML stack

Ai源码

1.0.0
awesome free chatgpt

Ai源码

1.0.0
pywin_contextmenu

Ai源码

Version update
Google Dorks

其他源码

1.0
shepherd

其他源码

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

其他源码

v1.1.0-rc-3

相关资讯全部