bi att flow DOWNLOAD - bi att flow Download

bi att flow

Anderer Quellcode

1.0.0

Herunterladen

Bidirektionaler Aufmerksamkeitsfluss für das Maschinenverständnis

Dies ist die ursprüngliche Implementierung des bidirektionalen Aufmerksamkeitsflusss für das Maschinenverständnis.
Das Codalab -Arbeitsblatt für die Einreichung der Kaderlangleiter ist hier verfügbar.
Für TensorFlow V1.2 -kompatible Version finden Sie im Dev -Zweig.
Bitte wenden Sie sich an Minjoon SEO (@seominjoon), um Fragen und Vorschläge zu erhalten.

0. Anforderungen

Allgemein

Python (überprüft auf 3.5.2. Ausgängen wurden mit Python 2 gemeldet!)
Unzip, WGet (nur zum Ausführen download.sh )

Python -Pakete

TensorFlow (Deep Learning Library, funktioniert nur auf R0.11)
NLTK (NLP -Tools, verifiziert auf 3.2.1)
TQDM (Fortschrittsbalken, verifiziert auf 4.7.4)
Jinja2 (zur Visauisierung; wenn Sie nur trainieren und testen, nicht benötigt)

1. Vorverarbeitung

Erstellen Sie zunächst Daten. Donwload Squad Data und Handschuh und NLTK Corpus (~ 850 MB, damit Dateien auf $HOME/data herunterladen):

 chmod +x download.sh; ./download.sh

Zweitens, Preprocess Stanford QA -Datensatz (zusammen mit Handschuhvektoren) und sparen Sie sie in $PWD/data/squad (~ 5 Minuten):

 python -m squad.prepro

2. Training

Das Modell hat ~ 2,5 m Parameter. Das Modell wurde mit Nvidia Titan X (Pascal Architecture, 2016) ausgebildet. Das Modell erfordert mindestens 12 GB GPU -RAM. Wenn Ihr GPU -RAM kleiner als 12 GB ist, können Sie entweder die Stapelgröße verringern (Leistung kann sich abbauen) oder Multi -GPU (siehe unten). Das Training konvergiert bei ~ 18.000 Schritten und dauerte ~ 4s pro Schritt (dh ~ 20 Stunden).

Vor dem Training wird empfohlen, zunächst den folgenden Code auszuprobieren, um zu überprüfen, ob alles in Ordnung ist und der Speicher ausreicht:

 python -m basic.cli --mode train --noload --debug

Dann, um vollständig zu trainieren, rennen Sie:

 python -m basic.cli --mode train --noload

Sie können den Trainingsprozess mit Optimierungsflags beschleunigen:

 python -m basic.cli --mode train --noload --len_opt --cluster

Sie können sie immer noch weglassen, aber das Training wird viel langsamer.

Beachten Sie, dass während des Trainings die EM- und F1 -Ergebnisse aus der gelegentlichen Bewertung mit der Punktzahl aus dem offiziellen Kader -Bewertungsskript nicht gleich sind. Die gedruckten Ergebnisse sind nicht offiziell (unser Bewertungsschema ist etwas härter). Um die offizielle Nummer zu erhalten, verwenden Sie den offiziellen Bewerter (kopiert in squad Ordner, squad/evaluate-v1.1.py ). Weitere Informationen finden Sie unter 3.test.

3. Test

Zu testen, rennen:

 python -m basic.cli

Ähnlich wie beim Training können Sie die Optimierungsflags geben, um den Test zu beschleunigen (5 Minuten für Entwicklungsdaten):

 python -m basic.cli --len_opt --cluster

Dieser Befehl lädt das zuletzt gespeicherte Modell während des Trainings und beginnt mit den Testdaten zu testen. Nach dem Ende des Vorgangs druckt es F1- und EM-Ergebnisse und gibt auch eine JSON-Datei aus ( $PWD/out/basic/00/answer/test-####.json , wobei #### der Schritt#ist, dass das Modell gespeichert wurde). Beachten Sie, dass die gedruckten Ergebnisse nicht offiziell sind (unser Bewertungsschema ist etwas härter). Verwenden Sie den offiziellen Bewerter (kopiert im squad -Ordner) und die Ausgabe -JSON -Datei, um die offizielle Nummer zu erhalten:

 python squad/evaluate-v1.1.py $HOME/data/squad/dev-v1.1.json out/basic/00/answer/test-####.json

3.1 Belastung aus vorgebrachten Gewichten

Anstatt das Modell selbst zu trainieren, können Sie sich dafür entscheiden, Gewichte vor ausgebildet zu verwenden, die für die Einreichung von Squad Bohrlochboard verwendet wurden. Siehe dieses Arbeitsblatt in Codalab, um die Ergebnisse zu reproduzieren. Wenn Sie mit Codalab nicht vertraut sind, befolgen Sie diese einfachen Schritte (da Sie alle oben genannten Voraussetzungen getroffen haben):

Download save.zip über das Arbeitsblatt und entpackt es im aktuellen Verzeichnis.
Kopieren Sie glove.6B.100d.txt $HOME/data/glove/
Einzelmodell reproduzieren:

 basic/run_single.sh $HOME/data/squad/dev-v1.1.json single.json

Dies schreibt die Antworten auf single.json im aktuellen Verzeichnis. Sie können dann den offiziellen Bewerter verwenden, um EM- und F1 -Scores zu erhalten. Wenn Sie mit GPU (~ 5 Minuten) ausführen möchten, ändern Sie den Wert des Batch_Size -Flags in der Shell -Datei in eine höhere Zahl (60 für 12 GB GPU -RAM). 4. In ähnlicher Weise reproduzieren Sie die Ensemble -Methode:

 basic/run_ensemble.sh $HOME/data/squad/dev-v1.1.json ensemble.json

Wenn Sie auf GPU ausführen möchten, sollten Sie das Skript nacheinander ausführen, indem Sie '&' in der Forloop entfernen, oder dass Sie für jeden Lauf der für die Loop unterschiedliche GPUs angeben müssen.

Ergebnisse

Entwicklerdaten

Beachten Sie, dass diese Bewertungen vom offiziellen Bewerter stammen (kopiert im squad Ordner, squad/evaluate-v1.1.py ). Weitere Informationen finden Sie unter 3.test. Die Bewertungen während des Trainings könnten niedriger sein als die Punktzahlen des offiziellen Bewerters.

	EM (%)	F1 (%)
einzel	67,7	77,3
Ensemble	72.6	80.7

Testdaten

	EM (%)	F1 (%)
einzel	68.0	77,3
Ensemble	73.3	81.1

Weitere Informationen finden Sie in unserer Arbeit. Siehe Squad Ranging Boardboard, um mit anderen Modellen zu vergleichen.

Multi-GPU-Training und -Tests

Unser Modell unterstützt Multi-GPU-Schulungen. Wir folgen dem Parallelisierungsparadigma, das im TensorFlow -Tutorial beschrieben wird. Kurz gesagt, wenn Sie eine Stapelgröße von 60 (Standard) verwenden möchten, aber wenn Sie 3 GPUs mit 4 GB RAM haben, initialisieren Sie jede GPU mit einer Chargengröße von 20 und kombinieren die Gradienten auf der CPU. Dies kann leicht durch Laufen erfolgen:

 python -m basic.cli --mode train --noload --num_gpus 3 --batch_size 20

Ebenso können Sie Ihre Tests beschleunigen nach:

 python -m basic.cli --num_gpus 3 --batch_size 20

Demo

Im Moment finden Sie im demo -Zweig dieses Repositorys.

Expandieren

Zusätzliche Informationen

Version 1.0.0
Typ Anderer Quellcode
Aktualisierungszeit 2025-04-17
Größe 136.66KB
Kommt von Github

Ähnliche Anwendungen

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Mobile Version von Color Flow 3D

2023-10-23
FLIESSEN

2023-07-14
Das Flow-Erlebnis

2022-07-26

bi att flow

Bidirektionaler Aufmerksamkeitsfluss für das Maschinenverständnis

0. Anforderungen

Allgemein

Python -Pakete

1. Vorverarbeitung

2. Training

3. Test

3.1 Belastung aus vorgebrachten Gewichten

Ergebnisse

Entwicklerdaten

Testdaten

Multi-GPU-Training und -Tests

Demo

GitHub sgrebnov/cordova plugin background download

Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

Mobile Version von Color Flow 3D

FLIESSEN

Das Flow-Erlebnis

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express