Большие языковые модели являются дорогими и медленными бегемотами, а оценка их на гигантских современных наборах данных только усугубляет.
Если бы только есть способ просто выбрать значимую ( и маленькую ) подмножество корпуса и получить высокую точную оценку .....
Подождите, звучит как байесовская оптимизация!
Бокоэль работает на следующих шагах:
Сгенеративные оценки легко управляются предоставленной утилитой менеджера.
Насколько нам известно, это первая работа, направленная на снижение затрат на вычисление во время оценки (сравнительный анализ) с (возможно, динамическим) бюджетом.
GPT2 , Pythia , LLAMA и многое другое посредством интеграции с трансформаторами Huggingface и наборами данныхКак то, что вы видите? Пожалуйста, подумайте о том, чтобы дать это звездой (★)!
Проще говоря, байесовская оптимизация направлена на оптимизацию либо объектива исследования (фиолетовая область на изображении), либо объект эксплуатации (высота черных точек). Он использует гауссовые процессы в качестве основы для вывода и использует функцию сбора , чтобы решить, где попробовать дальше. Смотрите здесь для более глубокого введения.
Поскольку байесовская оптимизация хорошо работает с моделью черного ящика для дорогих и оценить (Parphrase: LLM) , она идеально подходит для этого конкретного варианта использования. Bocoel использует байесовскую оптимизацию в качестве основы для изучения пространства встраивания, данного нашим корпусом, что позволяет ему выбрать хорошее подмножество, действующее в качестве мини -снимка корпуса.
LLMs мучительно медленные, особенно генеративные (что обычно называют LLM), поскольку генерация последовательности является последовательной по природе.
Несмотря на требование bocoel использовать Entgedder для кодирования всего корпуса, встраиватели быстрее, чем LLMS на порядки, и время получено практически любыми сбережениями при оценке LLMS.
Я не хочу дополнительных зависимостей:
pip install bocoel
Дайте мне полный опыт (все необязательные зависимости):
pip install "bocoel[all]"
Смотрите примеры папки/get get_started для упрощенного использования библиотеки, чтобы начать с нескольких строк кода.
Примеры использования находятся под examples папки. Ссылка на API можно найти здесь.
Администраторы хотели! Не стесняйся. Не стесняйтесь подавать проблемы и PRS. Для PRS, пожалуйста, следуйте руководству по внесению и кодексу поведения. Открытость и инклюзивность относятся очень серьезно.
Код доступен по лицензии BSD-3.
Если вы найдете этот проект полезным в своем исследовании, пожалуйста, укажите эту работу в
@misc{bocoel2024,
title = {BoCoEL: Bayesian Optimization as a Coverage Tool for Evaluating Large Language Models},
url = {https://bocoel.rentruewang.com/research/},
author = {Wang, RenChu},
month = {January},
year = {2024}
}