Descargar tianchi_nl2sql - Descargar el código fuente de tianchi

tianchi_nl2sql

Otro código fuente

1.0.0

Descargar

El primer desafío chino NL2SQL

Enlace de competencia

El organizador del conjunto de datos se ha hecho público y se puede descargar en https://github.com/zhuiyitechnology/tableqa

Código que ejecuta el entorno hasta el final del artículo

puntaje

El plan adoptado en este proyecto ocupa el quinto lugar en línea en la revancha y el tercero en los resultados finales.

El código debajo de la rama principal se presenta en forma de un cuaderno Jupyter. A los fines del aprendizaje y la comunicación, el código original se ha resuelto por una cierta cantidad y no reproducirá por completo los resultados en línea, pero el efecto no será mucho peor.

Model1.ipynb y Model2.IPynb en el directorio de código son procesos de modelado, y nl2sql/utils contiene algunas funciones básicas y estructuras de datos necesarias para esta tarea.

Expresiones de gratitud

Gracias a Sun Ningyuan de la tecnología Zhuiyi por proporcionar tutoría detallada previa al partido para esta competencia
Gracias a Su Jianlin, un investigador de tecnología Zhuiyi y un blogger de Space Science, por compartir una gran cantidad de publicaciones de blog de alta calidad en PNL. Este esquema está inspirado en el artículo "NL2SQL" basado en el modelo NL2SQL NL2SQL de Bert: una línea de base concisa ". La implementación del optimizador Radam utilizado en el proyecto proviene directamente del proyecto Keras_Radam de Su Jianlin
Gracias al proyecto de código abierto de Cyberzhg Keras-Bert, utilizamos Keras-Bert para construir nuestro modelo en esta competencia.
Gracias al proyecto chino-Bert-WWM del Laboratorio Conjunto Iflytek, utilizamos sus parámetros de modelo BERT-wwm, Chinese en esta competencia.

fondo

El primer desafío chino NL2SQL utiliza datos tabulares de los campos finanzas y generales como fuentes de datos para proporcionar pares coincidentes entre el lenguaje natural y las declaraciones SQL marcadas sobre esta base. Esperamos que los jugadores puedan usar datos para entrenar modelos que puedan convertir con precisión el lenguaje natural en SQL.

La entrada al modelo es una tabla de preguntas +, y se emite una estructura SQL, que corresponde a una declaración SQL.

en

sel es una lista, que representa la columna seleccionada por la instrucción SELECT
agg es una lista, correspondiente a sel , que indica qué operación de agregación se realiza en la columna, como Sum, Max, Min, etc.
conds es una lista, que representa una serie de condiciones en la declaración WHERE . Cada condición es un triple compuesto de (columnas de condición, operadores de condición, valores de condición).
cond_conn_op es un int, que representa la relación paralela entre las condiciones en conds , que pueden ser y o / o

Introducción al plan

Hacemos una transformación simple de la etiqueta original

Fusionar agg con sel , hacer predicciones para cada columna en la tabla en agg , y la nueva categoría NO_OP indica que la columna no está seleccionada
Divida conds en dos partes: conds_ops y conds_vals . La razón de esto es hacer predicciones en dos pasos. Un modelo primero predice qué columnas y operadores se seleccionarán conds , y luego otro modelo predice el valor de comparación de las columnas seleccionadas.

Modelo 1

Modelo 1 Conecte la pregunta con el encabezado secuencialmente, agregando un marcador especial, TEXT o REAL antes de cada columna. Estos dos tokens especiales pueden ser reemplazados por dos de los tokens no entrenados reservados por Bert.

La arquitectura del modelo 1 es la siguiente:

Modelo 2

El modelo 2 es responsable de la predicción de cond_val . Nuestra idea es enumerar cond_op y cond_val en función cond_col seleccionado por el Modelo 1, y generar una serie de combinaciones candidatas, tratando estas combinaciones como múltiples problemas de clasificación binaria.

La arquitectura del modelo 2 es la siguiente:

Finalmente, fusione las predicciones del Modelo 2 para algunas combinaciones de candidatos

Algunos intentos de exploración en el entrenamiento modelo

Para más detalles, consulte nuestro PPT de defensa final para su optimización en el entrenamiento de modelos y algunas ideas exitosas y no exitosas.

Entorno de ejecución de código

Marco de aprendizaje profundo: tensorflow, keras

Consulte requisitos.txt para versiones específicas

Una forma más conveniente de hacerlo es ejecutarlo en Docker. La siguiente imagen de Docker se utilizó en la competencia.

REPOSITORIO	ETIQUETA	ID de imagen
tensorflow/tensorflow	Nightly-Gpu-Py3-Jupyter	6E60684E9AA4

Como necesito usar Python3.6, uso la imagen de TensorFlow Nightly Build. Pasé la imagen que usé durante la competencia al Docker Hub, que se puede obtener a través del siguiente comando.

docker pull beader/tensorflow:nightly-gpu-py3-jupyter

Expandir

Información adicional

Versión 1.0.0
Tipo Otro código fuente
Fecha de actualización 2025-04-18
tamaño 2.09MB
Proviene de Github

Aplicaciones relacionadas

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Motor de análisis de datos Lihua versión gratuita 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recomendado para ti

chat.petals.dev

Otro código fuente

1.0.0
GPT Prompt Templates

Otro código fuente

1.0.0
GPTyped

Otro código fuente

GPTyped 1.0.5
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3
Google Dorks

Otro código fuente

1.0
shepherd

Otro código fuente

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Otro código fuente

v1.1.0-rc-3

Información relacionada Todo