bi att flow Download - bi att flow Code Source Download

bi att flow

Autre code source

1.0.0

Télécharger

Flux d'attention bidirectionnelle pour la compréhension de la machine

C'est la mise en œuvre originale du flux d'attention bidirectionnel pour la compréhension des machines.
La feuille de calcul Codalab pour la soumission des classements Squad est disponible ici.
Pour TensorFlow V1.2 Version compatible, voir la branche Dev.
Veuillez contacter Minjoon SEO (@seominjoon) pour des questions et des suggestions.

0. Exigences

Général

Python (vérifié sur 3.5.2. Des problèmes ont été signalés avec Python 2!)
unzip, wget (pour exécuter download.sh seulement)

Packages python

Tensorflow (bibliothèque d'apprentissage en profondeur, ne fonctionne que sur R0.11)
NLTK (outils NLP, vérifié sur 3.2.1)
TQDM (barre de progression, vérifié sur 4.7.4)
Jinja2 (pour la visaulisation; si vous ne vous entraînez et ne testez pas, pas nécessaire)

1. Pré-traitement

Premièrement, préparez les données. Donwload Squad Data and Glove et NLTK Corpus (~ 850 Mo, cela téléchargera des fichiers sur $HOME/data ):

 chmod +x download.sh; ./download.sh

Deuxièmement, l'ensemble de données de QA Stanford prétraitement (avec les vecteurs de gants) et les économiser dans $PWD/data/squad (~ 5 minutes):

 python -m squad.prepro

2. Formation

Le modèle a ~ 2,5 m de paramètres. Le modèle a été formé avec Nvidia Titan X (Pascal Architecture, 2016). Le modèle nécessite au moins 12 Go de RAM GPU. Si votre RAM GPU est inférieur à 12 Go, vous pouvez soit diminuer la taille du lot (les performances peuvent se dégrader), soit utiliser Multi GPU (voir ci-dessous). La formation converge à ~ 18 000 pas, et il a pris ~ 4 s par étape (c'est-à-dire ~ 20 heures).

Avant la formation, il est recommandé d'essayer d'abord le code suivant pour vérifier que tout est correct et la mémoire est suffisante:

 python -m basic.cli --mode train --noload --debug

Ensuite, pour s'entraîner complètement, courir:

 python -m basic.cli --mode train --noload

Vous pouvez accélérer le processus de formation avec des indicateurs d'optimisation:

 python -m basic.cli --mode train --noload --len_opt --cluster

Vous pouvez toujours les omettre, mais la formation sera beaucoup plus lente.

Notez que pendant la formation, les scores EM et F1 de l'évaluation occasionnelle ne sont pas les mêmes avec le score du script officiel d'évaluation de l'escouade. Les scores imprimés ne sont pas officiels (notre programme de notation est un peu plus dur). Pour obtenir le numéro officiel, utilisez l'évaluateur officiel (copié dans le dossier squad , squad/evaluate-v1.1.py ). Pour plus d'informations, voir 3.Test.

3. Test

Pour tester, exécuter:

 python -m basic.cli

De façon similaire à la formation, vous pouvez donner les drapeaux d'optimisation pour accélérer le test (5 minutes sur les données de développement):

 python -m basic.cli --len_opt --cluster

Cette commande charge le modèle le plus récemment enregistré pendant la formation et commence les tests sur les données de test. Une fois le processus se terminant, il imprime les scores F1 et EM, et publie également un fichier JSON ( $PWD/out/basic/00/answer/test-####.json , où #### est l'étape # que le modèle a été enregistré). Notez que les scores imprimés ne sont pas officiels (notre schéma de notation est un peu plus dur). Pour obtenir le numéro officiel, utilisez l'évaluateur officiel (copié dans le dossier squad ) et le fichier JSON de sortie:

 python squad/evaluate-v1.1.py $HOME/data/squad/dev-v1.1.json out/basic/00/answer/test-####.json

3.1 Chargement à partir de poids pré-formés

Au lieu de former le modèle vous-même, vous pouvez choisir d'utiliser des poids pré-formés qui ont été utilisés pour la soumission des classements Squad. Reportez-vous à cette feuille de travail dans le codalab pour reproduire les résultats. Si vous n'êtes pas familier avec le codalab, suivez ces étapes simples (étant donné que vous avez rencontré tous les préreqs ci-dessus):

Téléchargez save.zip à partir de la feuille de calcul et décompressez-la dans le répertoire actuel.
Copiez glove.6B.100d.txt dans votre dossier de données Glove ( $HOME/data/glove/ ) vers le répertoire actuel.
Pour reproduire un modèle unique:

 basic/run_single.sh $HOME/data/squad/dev-v1.1.json single.json

Cela écrit les réponses à single.json dans le répertoire actuel. Vous pouvez ensuite utiliser l'évaluateur officiel pour obtenir des scores EM et F1. Si vous souhaitez fonctionner sur GPU (~ 5 minutes), modifiez la valeur de l'indicateur Batch_Size dans le fichier shell en un nombre plus élevé (60 pour 12 Go GPU RAM). 4. De même, pour reproduire la méthode d'ensemble:

 basic/run_ensemble.sh $HOME/data/squad/dev-v1.1.json ensemble.json

Si vous souhaitez exécuter sur GPU, vous devez exécuter le script séquentiellement en supprimant '&' dans le forloop, ou vous devrez spécifier différents GPU pour chaque exécution de la boucle pour.

Résultats

Données de développement

Remarque Ces scores proviennent de l'évaluateur officiel (copié dans le dossier squad , squad/evaluate-v1.1.py ). Pour plus d'informations, voir 3.Test. Les scores sont apparus pendant la formation pourraient être inférieurs aux scores de l'évaluateur officiel.

	EM (%)	F1 (%)
célibataire	67.7	77.3
ensemble	72.6	80.7

Tester les données

	EM (%)	F1 (%)
célibataire	68.0	77.3
ensemble	73.3	81.1

Reportez-vous à notre article pour plus de détails. Voir Squad Leadboard pour comparer avec d'autres modèles.

Formation et tests multi-GPU

Notre modèle prend en charge la formation multi-GPU. Nous suivons le paradigme de parallélisation décrit dans le didacticiel TensorFlow. En bref, si vous souhaitez utiliser la taille du lot de 60 (par défaut), mais si vous avez 3 GPU avec 4 Go de RAM, vous initialisez chaque GPU avec une taille de lot de 20 et combinez les gradients sur CPU. Cela peut être facilement fait en fonctionnant:

 python -m basic.cli --mode train --noload --num_gpus 3 --batch_size 20

De même, vous pouvez accélérer vos tests en:

 python -m basic.cli --num_gpus 3 --batch_size 20

Démo

Pour l'instant, veuillez vous référer à la branche demo de ce référentiel.

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-04-17
taille 136.66KB
Provenant de Github

Applications connexes

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
Version mobile de Color Flow 3D

2023-10-23
COULER

2023-07-14
L'expérience de flux

2022-07-26

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout