tianchi_nl2sql Téléchargement - tianchi_nl2sql Code source Télécharger

tianchi_nl2sql

Autre code source

1.0.0

Télécharger

Le premier défi chinois NL2SQL

Lien de compétition

L'organisateur de l'ensemble de données a été rendu public et peut être téléchargé sur https://github.com/zhuiyitechnology/Tableqa

Code exécutant l'environnement jusqu'à la fin de l'article

score

Le plan adopté dans ce projet se classe cinquième en ligne dans le match revanche et troisième dans les résultats finaux.

Le code sous la branche principale est présenté sous la forme d'un cahier de jupyter. Aux fins de l'apprentissage et de la communication, le code d'origine a été réglé pour un certain montant et ne reproduira pas complètement les résultats en ligne, mais l'effet ne sera pas bien pire.

Model1.Ipynb et Model2.Ipynb dans le répertoire de code sont des processus de modélisation, et nl2sql/utils contient certaines fonctions de base et structures de données requises pour cette tâche.

Remerciements

Merci à Sun Ningyuan de la technologie Zhuiyi pour avoir fourni un tutorat d'avant-match détaillé pour ce concours
Grâce à Su Jianlin, chercheur de la technologie Zhuiyi et blogueur dans l'espace scientifique, pour avoir partagé un grand nombre de billets de blog de haute qualité sur NLP. Ce schéma est inspiré par l'article "NL2SQL" basé sur le modèle NL2SQL de Bert: une ligne de base concise ". La mise en œuvre de l'optimiseur Radam utilisé dans le projet provient directement du projet Open Source Keras_Radam de Su Jianlin
Grâce au projet open source de Cyberzhg, Keras-Bert, nous avons utilisé Keras-Bert pour construire notre modèle dans ce concours.
Grâce au projet chinois-BERT-WWM de Iflytek Joint Laboratory, nous avons utilisé leurs paramètres de modèle pré-formés BERT-wwm, Chinese dans ce concours.

arrière-plan

Le premier défi chinois NL2SQL utilise des données tabulaires des champs financiers et généraux comme sources de données pour fournir des paires correspondantes entre le langage naturel et les instructions SQL marquées sur cette base. Nous espérons que les joueurs pourront utiliser des données pour former des modèles qui peuvent convertir avec précision le langage naturel en SQL.

L'entrée du modèle est un tableau de question +, et une structure SQL est sortie, ce qui correspond à une instruction SQL.

dans

sel est une liste, représentant la colonne sélectionnée par l'instruction SELECT
agg est une liste, correspondant à sel , indiquant quelle opération d'agrégation est effectuée sur la colonne, telle que SUM, MAX, MIN, etc.
conds est une liste, représentant une série de conditions dans la déclaration WHERE . Chaque condition est un triple composé de (colonnes de condition, opérateurs de conditions, valeurs de condition).
cond_conn_op est un int, représentant la relation parallèle entre les conditions de conds , qui peuvent être et ou

Plan Introduction

Nous faisons une simple transformation de l'étiquette d'origine

Fusionner agg avec sel , faire des prédictions pour chaque colonne du tableau dans agg , et la nouvelle catégorie NO_OP indique que la colonne n'est pas sélectionnée
Divisez conds en deux parties: conds_ops et conds_vals . La raison en est de faire des prédictions en deux étapes. Un modèle prédit d'abord les colonnes et les opérateurs à sélectionner conds , puis un autre modèle prédit la valeur de comparaison des colonnes sélectionnées.

Modèle 1

Modèle 1 Connectez la question à l'en-tête séquentiellement, en ajoutant un marqueur spécial, TEXT ou REAL avant chaque colonne. Ces deux jetons spéciaux peuvent être remplacés par deux des jetons non entraînés réservés par Bert.

L'architecture du modèle 1 est la suivante:

Modèle 2

Le modèle 2 est responsable de la prédiction de cond_val . Notre idée est d'énumérer cond_op et cond_val sur la base cond_col sélectionné par le modèle 1, et de générer une série de combinaisons de candidats, traitant ces combinaisons comme plusieurs problèmes de classification binaire.

L'architecture du modèle 2 est la suivante:

Enfin, fusionnez les prédictions du modèle 2 pour certaines combinaisons de candidats

Quelques tentatives d'exploration dans la formation des modèles

Pour plus de détails, veuillez consulter notre Final Defense PPT pour l'optimisation dans la formation des modèles et quelques idées réussies et infructueuses.

Environnement de course de code

Cadre d'apprentissage en profondeur: Tensorflow, Keras

Voir exigences.txt pour des versions spécifiques

Un moyen plus pratique de le faire est de l'exécuter dans Docker. L'image Docker suivante a été utilisée dans la compétition

DÉPÔT	ÉTIQUETER	ID d'image
Tensorflow / Tensorflow	nocturne-gpu-py3-jupyter	6E60684E9AA4

Comme j'ai besoin d'utiliser Python3.6, j'utilise l'image de TensorFlow Nightly Build. J'ai passé l'image que j'ai utilisée lors de la compétition au Docker Hub, qui peut être obtenue via la commande suivante.

docker pull beader/tensorflow:nightly-gpu-py3-jupyter

Développer

Informations supplémentaires

Version 1.0.0
Type Autre code source
Date de mise à jour 2025-04-18
taille 2.09MB
Provenant de Github

Applications connexes

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Moteur d'analyse de données Lihua version gratuite 3.0_search_navigation_collection_public opinion_ranking_api

2022-06-28

Recommandé pour vous

chat.petals.dev

Autre code source

1.0.0
GPT Prompt Templates

Autre code source

1.0.0
GPTyped

Autre code source

GPTyped 1.0.5
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3
Google Dorks

Autre code source

1.0
shepherd

Autre code source

v6.1.6-react-shepherd: Prepare Release (#3063)
mongo express

Autre code source

v1.1.0-rc-3

Actualités connexes Tout