Большие языковые модели (LLMS) демонстрируют впечатляющее понимание естественного языка в разных задачах. По мере увеличения размера языковой модели их адаптация к конкретным задачам становится вычислительно дорогой. В качестве альтернативы стандартной точной настройке LLM было предложено в качестве альтернативы стандартной точной настройке LLM. Тем не менее, подсказка в целом снижает стандартную точную настройку. Кроме того, поиск лучших подсказок не является простым, так как процесс хрупкий, например, к формулировке подсказки и количества примеров. Для решения этих проблем была предложена эффективная точная настройка (PEFT). Эта парадигма добавляет модульные компоненты в предварительно обученную модель; Они точно настроены на целевую задачу, в то время как LLM не обновляется. Компоненты PEFT имеют выделенную емкость для за задание и разрешают обновлять модель, не забывая о предыдущих знаниях, в то время как состав таких модулей может улучшить возможности многозадачных возможностей LLM. PEFT может достичь производительности стандартной точной настройки. Это мотивировало исследования в этой области, и недавно было предложено множество методов. Однако, чтобы оценить, какой модульный подход подходит для набора задач, необходимы эксперименты с выбранными модульными подходами на задачу. Это часто требует исчерпывающего поиска по методам и гиперпараметрам, что на практике трудно. В этом исследовании предлагается новый критерий, основанный на матрице информации Фишера, чтобы выбрать, какой подход PEFT использовать для адаптации LLM к конкретной задаче. Роман априорный рыбак, информированный рыболов, префикс-настройки, адаптеры и LORA для трансформаторов, FishPal, избегает дорогостоящих экспериментов по тренировке и обучает только одну комбинацию на задачу. В экспериментах этого тезиса Fishpal последовательно превосходит базовые показатели по различным задачам клея, обновляя только 2-4% от общих параметров модели и добавляя только 0,4% параметров базовой модели во время вывода.
Все эксперименты проводились на 1 Google Cloud GPU (NVIDIA T4 GPU с 4VCPU и 15 ГБ ОЗУ в зоне US-WEST3-B)