Download few shot - download few shot do código -fonte

few shot

Pitão

1.0.0

Baixar

Aprendizagem de poucos tiros

O objetivo deste repositório é conter código limpo, legível e testado para reproduzir pesquisas de aprendizado de poucas fotos.

Este projeto foi escrito no Python 3.6 e Pytorch e assume que você tem uma GPU.

Veja esses artigos médios para mais informações

Teoria e conceitos
Discussão dos detalhes da implementação

Configurar

Requisitos

Listado no requirements.txt . Instale com pip install -r requirements.txt preferencialmente em um virtualenv.

Dados

Edite a variável DATA_PATH em config.py no local em que você armazena os conjuntos de dados Omniglot e MiniimageNet.

Depois de adquirir os dados e executar os scripts de configuração, sua estrutura de pasta deve parecer

 DATA_PATH/
    Omniglot/
        images_background/
        images_evaluation/
    miniImageNet/
        images_background/
        images_evaluation/

DataSet Omniglot . Faça o download de https://github.com/brendenlake/omniglot/tree/master/python, coloque os arquivos extraídos em DATA_PATH/Omniglot_Raw e execute scripts/prepare_omniglot.py

conjunto de dados de miniimagenet . Faça o download de arquivos de https://drive.google.com/file/d/0b3irx3uqnobmq1flnxjszudywee/view, coloque em data/miniImageNet/images e run scripts/prepare_mini_imagenet.py

Testes (opcionais)

Depois de adicionar os conjuntos de dados, execute pytest no diretório raiz para executar todos os testes.

Resultados

Os experiments/experiments.txt de arquivo.txt contém os hiperparâmetros que eu usei para obter os resultados fornecidos abaixo.

Redes prototípicas

Execute experiments/proto_nets.py para reproduzir resultados de redes prototpyical para aprendizado de poucos tiro (Snell et al).

Argumentos

conjunto de dados: {'omniglot', 'miniimageNet'}. Se deve usar o conjunto de dados Omniglot ou MiniimageNet
Distância: {'L2', 'Cosine'}. Qual métrica de distância usar
N-TRANH: Apoio a amostras por classe para tarefas de treinamento
n-teste: amostras de suporte por classe para tarefas de validação
K-TRAIN: Número de classes em tarefas de treinamento
K-teste: número de classes em tarefas de validação
Q-Train: amostras de consulta por classe para tarefas de treinamento
Q-test: amostras de consulta por classe para tarefas de validação

	Omniglot
K-Way	5	5	20	20
n-shot	1	5	1	5
Publicado	98.8	99.7	96.0	98.9
Este repo	98.2	99.4	95.8	98.6

	Miniimagenet
K-Way	5	5
n-shot	1	5
Publicado	49.4	68.2
Este repo	48.0	66.2

Redes correspondentes

Um classificador de vizinhos mais próximos diferenciável.

Redes correspondentes

Execute experiments/matching_nets.py para reproduzir resultados de redes correspondentes para um aprendizado de um tiro (Vinyals et al).

Argumentos

conjunto de dados: {'omniglot', 'miniimageNet'}. Se deve usar o conjunto de dados Omniglot ou MiniimageNet
Distância: {'L2', 'Cosine'}. Qual métrica de distância usar
N-TRANH: Apoio a amostras por classe para tarefas de treinamento
n-teste: amostras de suporte por classe para tarefas de validação
K-TRAIN: Número de classes em tarefas de treinamento
K-teste: número de classes em tarefas de validação
Q-Train: amostras de consulta por classe para tarefas de treinamento
Q-test: amostras de consulta por classe para tarefas de validação
FCE: seja (verdadeiro) ou não (falso) para usar incorporações completas de contexto (FCE)
camadas LSTM: Número de camadas LSTM para usar no conjunto de suporte FCE
Repolling etapas: Número de etapas desenroladas a serem usadas ao calcular o FCE da amostra de consulta

Tive problemas para reproduzir os resultados deste artigo usando a métrica de distância cosseno, pois achei que o converge era lento e final de desempenho dependente da inicialização aleatória. No entanto, consegui reproduzir (e exceder ligeiramente) os resultados deste artigo usando a métrica de distância L2.

	Omniglot
K-Way	5	5	20	20
n-shot	1	5	1	5
Publicado (Cosine)	98.1	98.9	93.8	98.5
Este repo (cosseno)	92.0	93.2	75.6	77.8
Este repo (L2)	98.3	99.8	92.8	97.8

	Miniimagenet
K-Way	5	5
n-shot	1	5
Publicado (Cosine, FCE)	44.2	57.0
Este repo (cosseno, fce)	42.8	53.6
Este repo (L2)	46.0	58.4

Meta-aprendizagem modelo-agnóstico (MAML)

Maml

Eu usei o pool máximo em vez de convoluções atrapalhadas para ser consistente com os outros papéis. Os experimentos MiniimageNet usando Maml de 2ª Ordem me levaram a um dia para correr.

Execute experiments/maml.py para reproduzir os resultados da meta-aprendizagem modelo-agnóstica (Finn et al).

Argumentos

conjunto de dados: {'omniglot', 'miniimageNet'}. Se deve usar o conjunto de dados Omniglot ou MiniimageNet
Distância: {'L2', 'Cosine'}. Qual métrica de distância usar
N: Apoio a amostras por classe para tarefas de poucas tiro
K: Número de aulas em tarefas de treinamento
P: Amostras de consulta por classe para tarefas de treinamento
Etapas internas de treino: Número de atualizações de loop interno para executar em tarefas de treinamento
Etações internas: número de atualizações de loop interno para executar em tarefas de validação
Inner-LR: Taxa de aprendizado para usar para atualizações de loop interno
Meta-LR: Taxa de aprendizado a ser usada ao atualizar os pesos da meta-aprendizagem
META-LATCHSIM: Número de tarefas por meta-lotes
Ordem: se deve usar o 1º ou o 2º pedido maml
épocas: número de épocas de treinamento
Epoch-len: Meta-lotes por época
Patches de avaliação: número de meta-lotes a serem usados ao avaliar o modelo após cada época

NB: Para maml n, k e q são fixados entre o trem e o teste. Pode ser necessário ajustar o tamanho de meta-lotes para se ajustar à sua GPU. 2ª ordem MAML usa muito mais memória.