few shot -Download - few shot -Source -Code -Download

few shot

Python

1.0.0

Herunterladen

Wenige Schüsse Lernen

Das Ziel für dieses Repository ist es, saubere, lesbare und getestete Code zu enthalten, um nur wenige Schusslernforschung zu reproduzieren.

Dieses Projekt ist in Python 3.6 und Pytorch geschrieben und geht davon aus, dass Sie eine GPU haben.

Weitere Informationen finden Sie in diesen mittleren Artikeln

Theorie und Konzepte
Diskussion der Implementierungsdetails

Aufstellen

Anforderungen

In requirements.txt aufgelistet.txt. Installieren Sie mit pip install -r requirements.txt vorzugsweise in einem virtuellenv.

Daten

Bearbeiten Sie die Variable DATA_PATH in config.py an dem Ort, an dem Sie die Omniglot- und Miniimagenet -Datensätze speichern.

Nachdem Sie die Daten erfasst und die Setup -Skripte ausgeführt haben, sollte Ihre Ordnerstruktur nachsehen

 DATA_PATH/
    Omniglot/
        images_background/
        images_evaluation/
    miniImageNet/
        images_background/
        images_evaluation/

Omniglot -Datensatz. Laden Sie von https://github.com/brendenlake/omniglot/tree/master/python herunter, platzieren Sie die extrahierten Dateien in DATA_PATH/Omniglot_Raw scripts/prepare_omniglot.py führen

Miniimagenet -Datensatz. Laden scripts/prepare_mini_imagenet.py Dateien von https://drive.google.com/file/d/0b3irx3uqnobmq1flnxjszudywee/Ve data/miniImageNet/images

Tests (optional)

Nach dem Hinzufügen der Datensätze führen Sie pytest im Stammverzeichnis aus, um alle Tests auszuführen.

Ergebnisse

Die Dateiversuche experiments/experiments.txt enthält die Hyperparameter, mit denen ich die nachstehend angegebenen Ergebnisse erhalten habe.

Prototypische Netzwerke

Führen Sie experiments/proto_nets.py aus, um Ergebnisse aus prototpyischen Netzwerken für wenige Shot-Lernen zu reproduzieren (Snell et al.).

Argumente

Datensatz: {'Omniglot', 'Miniimagenet'}. Ob Sie den Omniglot- oder Miniimagenet -Datensatz verwenden möchten
Entfernung: {'l2', 'Cosinus'}. Welche Distanzmetrik zu verwenden
N-train: Unterstützen Sie Proben pro Klasse für Trainingsaufgaben
N-Test: Unterstützen Sie Proben pro Klasse für Validierungsaufgaben
K-Train: Anzahl der Klassen in Trainingsaufgaben
K-Test: Anzahl der Klassen in Validierungsaufgaben
q-train: Abfragen von Proben pro Klasse für Trainingsaufgaben
Q-Test: Abfragen von Proben pro Klasse für Validierungsaufgaben

	Omniglot
K-Way	5	5	20	20
N-Shot	1	5	1	5
Veröffentlicht	98,8	99.7	96.0	98,9
Dieses Repo	98.2	99.4	95.8	98.6

	Miniimagenet
K-Way	5	5
N-Shot	1	5
Veröffentlicht	49,4	68,2
Dieses Repo	48.0	66,2

Passende Netzwerke

Ein differenzierbarer Klassifikator der nächsten Nachbarn.

Passende Netzwerke

Führen Sie experiments/matching_nets.py aus, um Ergebnisse aus passenden Netzwerken für ein Schusslernen zu reproduzieren (Vinyals et al.).

Argumente

Datensatz: {'Omniglot', 'Miniimagenet'}. Ob Sie den Omniglot- oder Miniimagenet -Datensatz verwenden möchten
Entfernung: {'l2', 'Cosinus'}. Welche Distanzmetrik zu verwenden
N-train: Unterstützen Sie Proben pro Klasse für Trainingsaufgaben
N-Test: Unterstützen Sie Proben pro Klasse für Validierungsaufgaben
K-Train: Anzahl der Klassen in Trainingsaufgaben
K-Test: Anzahl der Klassen in Validierungsaufgaben
q-train: Abfragen von Proben pro Klasse für Trainingsaufgaben
Q-Test: Abfragen von Proben pro Klasse für Validierungsaufgaben
FCE: ob (wahr) oder nicht (falsch), um den vollständigen Kontext -Einbettungen (FCE) zu verwenden
LSTM-Layer: Anzahl der LSTM-Ebenen, die im Support Set FCE verwendet werden sollen
Ausrollungsschritte: Anzahl der Abladungsschritte, die bei der Berechnung der FCE der Abfrageprobe verwendet werden sollen

Ich hatte Probleme, die Ergebnisse dieses Papiers unter Verwendung der Cosinus Distance Metrik zu reproduzieren, da ich feststellte, dass der Konverge langsam und endgültig von der zufälligen Initialisierung abhängt. Ich konnte jedoch die Ergebnisse dieses Papiers mit der L2 -Entfernungsmetrik reproduzieren (und etwas überschreiten).

	Omniglot
K-Way	5	5	20	20
N-Shot	1	5	1	5
Veröffentlicht (Cosinus)	98.1	98,9	93.8	98,5
Dieses Repo (Cosinus)	92.0	93.2	75,6	77,8
Dieses Repo (L2)	98.3	99,8	92.8	97,8

	Miniimagenet
K-Way	5	5
N-Shot	1	5
Veröffentlicht (Cosinus, FCE)	44,2	57.0
Dieses Repo (Cosinus, FCE)	42,8	53.6
Dieses Repo (L2)	46.0	58,4

Modell-agnostisches Meta-Learning (MAML)

Maml

Ich habe Max -Pooling anstelle von Schrittwandnungen verwendet, um mit den anderen Papieren übereinzustimmen. Die Miniimagenet -Experimente mit MAML 2. Order haben mich über einen Tag gebracht, um zu laufen.

Führen Sie experiments/maml.py zur Reproduktion von Ergebnissen aus Modell-Agnostic Meta-Learning (Finn et al.).

Argumente

Datensatz: {'Omniglot', 'Miniimagenet'}. Ob Sie den Omniglot- oder Miniimagenet -Datensatz verwenden möchten
Entfernung: {'l2', 'Cosinus'}. Welche Distanzmetrik zu verwenden
N: Unterstützen Sie Proben pro Klasse für wenige Aufgaben
K: Anzahl der Klassen in Trainingsaufgaben
F: Abfragen von Proben pro Klasse für Trainingsaufgaben
Inner-Train-Steps: Anzahl der Inner-Schleifen-Updates, die bei Trainingsaufgaben ausgeführt werden können
Innen-Val-Steps: Anzahl der Innenschleif-Updates, die bei Validierungsaufgaben durchgeführt werden können
Inner-LR: Lernrate für Inner-Schleife-Updates zu verwenden
META-LR: Lernrate, die bei der Aktualisierung der Meta-Learner-Gewichte verwendet werden muss
Meta-Batch-Größe: Anzahl der Aufgaben pro Meta-Batch
Bestellung: Ob Sie die 1. oder 2. Auftragsmaml verwenden möchten
Epochen: Anzahl der Trainingsspochs
Epoch-Len: Meta-Stapel pro Epoche
Evalbatches: Anzahl der Meta-Stapel, die bei der Bewertung des Modells nach jeder Epoche verwendet werden sollen

NB: Für MAML N, K und Q sind zwischen Zug und Test festgelegt. Möglicherweise müssen Sie die Meta-Batch-Größe an Ihre GPU einstellen. 2. Ordnung MAML verwendet viel mehr Speicher.