Descargar gap text2sql - Descargar el código fuente de gap text2sql

gap text2sql

Código Fuente de IA

1.0.0

Descargar

GAP-Text2SQL: Representaciones contextuales de aprendizaje para el análisis semántico con pre-entrenamiento acuático de generación

Código y modelo de nuestro artículo AAAI 2021

Actualizaciones

[2020/02/05] Soporte para ejecutar el modelo en bases de datos y consultas propias. Mira el cuaderno.

Abstracto

Más recientemente, ha habido un interés significativo en el aprendizaje de representaciones contextuales para varias tareas de PNL, al aprovechar los corpus de texto a gran escala para capacitar a grandes modelos de lenguaje neuronal con objetivos de aprendizaje auto-supervisados, como el modelo de lenguaje enmascarado (MLM). Sin embargo, con base en un estudio piloto, observamos tres problemas de los modelos de lenguaje de uso general existentes cuando se aplican a los analizadores semánticos de texto a SQL: no detectar las menciones de columnas en las expresiones, no inferen las menciones de columnas de los valores celulares y no componen consultas SQL complejas. Para mitigar estos problemas, presentamos un marco modelo previo al entrenamiento, pre-entrenamiento acuático (GAP) de generación, que aprende conjuntamente representaciones de las expresiones del lenguaje natural y los esquemas de tabla al aprovechar los modelos de generación para generar datos previos al entrenamiento. El modelo GAP está entrenado en pares de Schema-Schema de 2M y triples de 30k en absoluto-Schema-SQL, cuyas expresiones son producidas por modelos generativos. Según los resultados experimentales, los analizadores semánticos neuronales que aprovechan el modelo GAP como un codificador de representación obtienen nuevos resultados de última generación en los puntos de referencia de araña y criterios a SQL.

Configuración

conda create --name gap-text2sql python=3.7
source activate gap-text2sql
conda install pytorch=1.5 cudatoolkit=10.2 -c pytorch
pip install -r requirements.txt
python -c " import nltk; nltk.download('stopwords'); nltk.download('punkt') "

Descargar el conjunto de datos

pip install gdown
cd rat-sql-gap
gdown --id 1_AckYkinAnhqmRQtGsQgUKAnTHxxX5J0
unzip spider.zip
bash data/spider/generate.sh ./spider

Construir directorio de conjunto de datos

mkdir data/spider-bart
cp ./spider/tables.json data/spider-bart/
cp ./spider/train_spider.json data/spider-bart/
cp ./spider/train_others.json data/spider-bart/
cp ./spider/dev.json data/spider-bart/
ln -s $( pwd ) /spider/database data/spider-bart/database

Descargar la biblioteca

mkdir third_party
wget http://nlp.stanford.edu/software/stanford-corenlp-full-2018-10-05.zip
unzip stanford-corenlp-full-2018-10-05.zip -d third_party/

Comience la biblioteca de Stanford

 pushd third_party/stanford-corenlp-full-2018-10-05
nohup java -mx4g -cp " * " edu.stanford.nlp.pipeline.StanfordCoreNLPServer -port 8999 -timeout 15000 > server.log &
popd

Descargar el punto de control

mkdir -p logdir/bart_run_1/bs = 12 , lr = 1.0e-04 , bert_lr = 1.0e-05 , end_lr = 0e0 , att = 1/
mkdir ie_dirs
aws s3 cp s3://gap-text2sql-public/checkpoint-artifacts/gap-finetuned-checkpoint logdir/bart_run_1/bs = 12 , lr = 1.0e-04 , bert_lr = 1.0e-05 , end_lr = 0e0 , att = 1/model_checkpoint-00041000

mkdir -p pretrained_checkpoint
aws s3 cp s3://gap-text2sql-public/checkpoint-artifacts/pretrained-checkpoint pretrained_checkpoint/pytorch_model.bin

Alternativamente, puede descargarlos aquí si no tiene AWSCLI: Gap-Finetuned Checkpoint y Prained-Checkpoint

curl https://gap-text2sql-public.s3.amazonaws.com/checkpoint-artifacts/gap-finetuned-checkpoint -o logdir/bart_run_1/bs = 12 , lr = 1.0e-04 , bert_lr = 1.0e-05 , end_lr = 0e0 , att = 1/model_checkpoint-00041000
curl https://gap-text2sql-public.s3.amazonaws.com/checkpoint-artifacts/pretrained-checkpoint -o pretrained_checkpoint/pytorch_model.bin

Conjunto de datos de preprocesos

python run.py preprocess experiments/spider-configs/gap-run.jsonnet

Inferencia

python run.py eval experiments/spider-configs/gap-run.jsonnet

Luego obtiene los resultados de inferencia y los resultados de evaluación en las rutas: ie_dirs/bart_run_1_true_1-step41000.infer E ie_dirs/bart_run_1_true_1-step41000.eval .

Capacitación

python run.py train experiments/spider-configs/gap-run.jsonnet

Seguridad

Ver contribuyendo para más información.

Licencia

Este proyecto tiene licencia bajo la licencia Apache-2.0.

Expandir

Información adicional

Versión 1.0.0
Tipo Código Fuente de IA
Fecha de actualización 2025-09-10
tamaño 249.7KB
Proviene de Github

Aplicaciones relacionadas

GitHub sgrebnov/cordova plugin background download

2024-11-05
Wa ch ull navra maza navsacha 2 2024 ull ovie Fr e Online On Strea ings

2024-11-03
Wa ch navra maza navsacha 2 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-03
Wa ch the greatest of all time 2024 ull ovie Online For Fr e Strea ings At Home

2024-11-02
wolfs 2024 f llmo ie f lmyz lla dow load ree 7 0p 4 0p a d 10 0p

2024-11-01
GitHub actions/download artifact

2024-11-01

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
ML stack

Código Fuente de IA

1.0.0
awesome free chatgpt

Código Fuente de IA

1.0.0
pywin_contextmenu

Código Fuente de IA

Version update
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo