few shot

few shot

Питон

1.0.0

Скачать

Несколько выстрелов

Цель этого хранилища-содержать чистый, читаемый и протестированный код для воспроизведения исследований в области обучения.

Этот проект написан в Python 3.6 и Pytorch и предполагает, что у вас есть графический процессор.

Смотрите эти средние статьи для получения дополнительной информации

Теория и концепции
Обсуждение деталей реализации

Настраивать

Требования

Перечислен в requirements.txt . Установите с помощью pip install -r requirements.txt предпочтительно в VirtualENV.

Данные

Отредактируйте переменную DATA_PATH в config.py в то место, где вы храните наборы данных Omniglot и Miniimagenet.

После получения данных и запуска сценариев настроек ваша структура папок должна выглядеть как

 DATA_PATH/
    Omniglot/
        images_background/
        images_evaluation/
    miniImageNet/
        images_background/
        images_evaluation/

Набор данных OMNIGLOT . Скачать с https://github.com/brendenlake/omniglot/tree/master/python, поместите извлеченные файлы в DATA_PATH/Omniglot_Raw и запустить scripts/prepare_omniglot.py

Набор данных Miniimagenet . Скачать файлы с https://drive.google.com/file/d/0b3irx3uqnobmq1flnxjszudywee/view, место в data/miniImageNet/images и запустить scripts/prepare_mini_imagenet.py

Тесты (необязательно)

После добавления наборов данных запустите pytest в корневом каталоге для запуска всех тестов.

Результаты

File experiments/experiments.txt содержит гиперпараметры, которые я использовал для получения результатов, приведенных ниже.

Прототипические сети

Запустите experiments/proto_nets.py , чтобы воспроизвести результаты прототпитических сетей для нескольких выстрелов (Snell et al).

Аргументы

Набор данных: {'Omniglot', 'miniimagenet'}. Использовать ли набор данных Omniglot или Miniimagenet
Расстояние: {'l2', 'cosine'}. Какую метрику расстояния использовать
N-Train: поддержка образцов на класс для учебных задач
n-test: поддержка образцов для каждого класса для проверки задач
K-Train: количество занятий в учебных задачах
k-test: количество классов в задачах проверки
Q-Train: образцы запроса на класс для тренировочных задач
Q-тест: образцы запроса на класс для проверки задач

	Омниглат
k-way	5	5	20	20
n-shot	1	5	1	5
Опубликовано	98.8	99,7	96.0	98.9
Это репо	98.2	99,4	95,8	98.6

	Miniimagenet
k-way	5	5
n-shot	1	5
Опубликовано	49,4	68.2
Это репо	48.0	66.2

Соответствующие сети

Дифференцируемый классификатор ближайших соседей.

Соответствующие сети

Запустите experiments/matching_nets.py , чтобы воспроизводить результаты сопоставления сетей для одного выстрела (Vinyanals et al).

Аргументы

Набор данных: {'Omniglot', 'miniimagenet'}. Использовать ли набор данных Omniglot или Miniimagenet
Расстояние: {'l2', 'cosine'}. Какую метрику расстояния использовать
N-Train: поддержка образцов на класс для учебных задач
n-test: поддержка образцов для каждого класса для проверки задач
K-Train: количество занятий в учебных задачах
k-test: количество классов в задачах проверки
Q-Train: образцы запроса на класс для тренировочных задач
Q-тест: образцы запроса на класс для проверки задач
FCE: (True) или нет (false) для использования полных контекстов (FCE)
LSTM-слои: количество слоев LSTM для использования в наборе поддержки FCE
развертывание шагов: количество развертывающих шагов для использования при расчете FCE образца запроса

У меня были проблемы с воспроизведением результатов этой статьи, используя метрику расстояния косинуса, так как я обнаружил, что сходится медленная, а конечная производительность зависит от случайной инициализации. Однако я смог воспроизвести (и немного превышать) результаты этой статьи, используя метрику расстояния L2.

	Омниглат
k-way	5	5	20	20
n-shot	1	5	1	5
Опубликовано (косинус)	98.1	98.9	93,8	98.5
Это репо (косинус)	92.0	93.2	75,6	77.8
Это репо (L2)	98.3	99,8	92,8	97.8

	Miniimagenet
k-way	5	5
n-shot	1	5
Опубликовано (Cosine, FCE)	44.2	57.0
Это репо (косинус, FCE)	42,8	53,6
Это репо (L2)	46.0	58.4

Модель-агрессия мета-обучение (MAML)

Мамл

Я использовал максимальный объединение вместо того, чтобы усердные свертки, чтобы соответствовать другим документам. Эксперименты Miniimagenet с использованием 2 -го порядка Maml потребовалось мне более дня.

Запустите experiments/maml.py , чтобы воспроизвести результаты, связанные с моделью-алтаиновым обучением (Finn et al).

Аргументы

Набор данных: {'Omniglot', 'miniimagenet'}. Использовать ли набор данных Omniglot или Miniimagenet
Расстояние: {'l2', 'cosine'}. Какую метрику расстояния использовать
N: Образцы поддержки на класс для нескольких выстрелов
K: Количество занятий в учебных задачах
Q: Образцы запросов на класс для тренировочных задач
Внутренние шаги: количество обновлений внутренних петлей для выполнения учебных задач
Внутренние шаги: количество обновлений внутренней петли для выполнения задач проверки
Внутренний LR: скорость обучения для использования для обновлений внутренней петли
Meta-LR: скорость обучения для использования при обновлении весов мета-производителя
Мета-размер: количество задач на мета-партию
Заказ: использовать 1 -й или 2 -й заказ MAML
эпохи: количество тренировочных эпох
эпох-полене: мета-партии на эпоху
Оценки оценки: количество мета-партий для использования при оценке модели после каждой эпохи

NB: для Maml N, K и Q фиксируются между поездом и тестом. Возможно, вам придется отрегулировать мета-размеров, чтобы соответствовать вашему графическому процессору. 2 -й заказ Maml использует гораздо больше памяти.