rat sql Download - rat sql SQL Code Source Download

rat sql

Autre code source

1.0.0

Télécharger

Rat-SQL

Ce référentiel contient du code pour le papier ACL 2020 "Rat-SQL: Relation-Aware Schema Encoding et liant pour les analyseurs de texte à SQL".

Si vous utilisez Rat-SQL dans votre travail, veuillez le citer comme suit:

 @inproceedings { rat-sql ,
    title = " {RAT-SQL}: Relation-Aware Schema Encoding and Linking for Text-to-{SQL} Parsers " ,
    author = " Wang, Bailin and Shin, Richard and Liu, Xiaodong and Polozov, Oleksandr and Richardson, Matthew " ,
    booktitle = " Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics " ,
    month = jul,
    year = " 2020 " ,
    address = " Online " ,
    publisher = " Association for Computational Linguistics " ,
    pages = " 7567--7578 "
}

Changelog

2020-08-14:

L'image Docker hérite désormais d'une image de base compatible Cuda.
Exigences clarifiées de la mémoire et de l'ensemble de données sur l'image.
Correction du problème où les ID de jeton n'ont pas été convertis en ID de pièce de mots pour la liaison de la valeur Bert.

Usage

Étape 1: Téléchargez des ensembles de données et des dépendances tiers

Téléchargez les ensembles de données: Spider et Wikisql. En cas de Spider, assurez-vous de télécharger la version 08/03/2020 ou plus récente. Déballer les ensembles de données quelque part en dehors de ce projet pour créer la structure du répertoire suivant:

 /path/to/data
├── spider
│   ├── database
│   │   └── ...
│   ├── dev.json
│   ├── dev_gold.sql
│   ├── tables.json
│   ├── train_gold.sql
│   ├── train_others.json
│   └── train_spider.json
└── wikisql
    ├── dev.db
    ├── dev.jsonl
    ├── dev.tables.jsonl
    ├── test.db
    ├── test.jsonl
    ├── test.tables.jsonl
    ├── train.db
    ├── train.jsonl
    └── train.tables.jsonl

Pour travailler avec l'ensemble de données Wikisql, clonez ses scripts d'évaluation dans ce projet:

mkdir -p third_party
git clone https://github.com/salesforce/WikiSQL third_party/wikisql

Étape 2: construire et exécuter l'image docker

Nous avons fourni un Dockerfile qui vous configure l'environnement entier. Il suppose que vous montez les ensembles de données téléchargés à l'étape 1 en tant que volume /mnt/data dans une image en cours. Ainsi, la configuration de l'environnement pour Rat-SQL est:

docker build -t ratsql .
docker run --rm -m4g -v /path/to/data:/mnt/data -it ratsql

Notez que l'image nécessite au moins 4 Go de RAM pour exécuter le prétraitement. Par défaut, Docker Desktop pour Mac et Docker Desktop pour Windows Exécutent des conteneurs avec 2 Go de RAM. Le commutateur -m4g le remplace; Alternativement, vous pouvez augmenter la limite par défaut des paramètres de bureau Docker.

Si vous préférez configurer et exécuter la base de code sans docker, suivez les étapes de Dockerfile une par une. Notez que ce référentiel nécessite Python 3.7 ou plus et un JVM pour exécuter Stanford Corenlp.

Étape 3: Exécutez les expériences

Chaque expérience a son propre fichier de configuration dans experiments . Le pipeline de travail avec n'importe quelle version ou ensemble de données de modèle est:

python run.py preprocess experiment_config_file  # Step 3a: preprocess the data
python run.py train experiment_config_file       # Step 3b: train a model
python run.py eval experiment_config_file        # Step 3b: evaluate the results

Utilisez les fichiers de configuration d'expérience suivants pour reproduire nos résultats:

Spider, Glove Version: experiments/spider-glove-run.jsonnet
Spider, Bert Version (nécessite un GPU avec au moins 16 Go de mémoire): experiments/spider-bert-run.jsonnet
Wikisql, Glove Version: experiments/wikisql-glove-run.jsonnet

La précision exacte du modèle peut varier de ± 2% en fonction d'une graine aléatoire. Voir le papier pour plus de détails.

Contributif

Ce projet accueille les contributions et les suggestions. La plupart des contributions vous obligent à accepter un accord de licence de contributeur (CLA) déclarant que vous avez le droit de faire et en fait, accordez-nous les droits d'utilisation de votre contribution. Pour plus de détails, visitez https://cla.opensource.microsoft.com.

Lorsque vous soumettez une demande de traction, un bot CLA déterminera automatiquement si vous devez fournir un CLA et décorer le RP de manière appropriée (par exemple, vérification d'état, commentaire). Suivez simplement les instructions fournies par le bot. Vous n'aurez besoin de le faire qu'une seule fois sur tous les dépositions en utilisant notre CLA.

Ce projet a adopté le code de conduite open source Microsoft. Pour plus d'informations, consultez le code de conduite FAQ ou contactez [email protected] avec toute question ou commentaire supplémentaire.

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-04-15
taille 109.18KB
Provenant de Github

Applications connexes

Rat de laboratoire

2022-08-08
Tête première SQL

2010-03-29
Copain SQL

2009-09-15
Serveur SQL

2009-07-04
Manuel de référence Microsoft Jet SQL

2009-05-31
Version SQL Business Express

2009-04-22

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout