Anglais |中文版| Papier
Tutoriels et ressources organisés pour les modèles de grande langue, Text2SQL, Text2DSL, Text2API, Text2vis et plus encore.
Nous accueillons chaleureusement les contributions de tout le monde, que vous ayez trouvé une faute de frappe, un bug, une suggestion ou que vous souhaitiez partager une ressource liée à LLM + Text2SQL. Pour des directives détaillées sur la façon de contribuer, veuillez consulter notre fichier contribution.md.
| Wikisql | Araignée Correspondance exacte (em) | Araignée Exécution exacte (ex) | OISEAU Score d'efficacité valide basé sur les récompenses (R-VE) | OISEAU Précision d'exécution (ex) | |
|---|---|---|---|---|---|
| ? 1 | 93.0 (2021/05-Sead + Décodage guidé par l'exécution) | 81.5 (2023/11-MINISEEK) | 91.2 (2023/11-MINISEEK) | 69.36 (2024/08-Opensearch-SQL, V2 + GPT-4O) | 73.00 (2024/09-Chase-SQL + Gemini) |
| ? 2 | 92.7 (2021/03-SDSQL + Décodage guidé par l'exécution) | 74.0 (2022/09-GRAPHIX-3B + PICARD) | 86.6 (2023/08-DAIL-SQL + GPT-4 + Auto-cohérence) | 68.79 (2024/08-exsl + granit-34b-code) | 72.39 (2024/09-ASKDATA + GPT-4O) |
| ? 3 | 92.5 (2020/11-IE-SQL + Décodage guidé par l'exécution) | 73.9 (2022/09-CATSQL + Grappa) | 86.2 (2023/08-DAIL-SQL + GPT-4) | 68.44 (2024/09-Chase-SQL + Gemini) | 72.28 (2024/08-Opensearch-SQL, V2 + GPT-4O) |
| 4 | 92.2 (2020/03-hydranet + décodage guidé par l'exécution) | 73.1 (2022/09-navire + picard) | 85.6 (2023/10-dpg-sql + gpt-4 + auto-correction) | 67.41 (2024/07-Distillery + GPT-4O) | 71.83 (2024/07-Distillery + GPT-4O) |
| 5 | 91.9 (2020/12-pont + décodage guidé par l'exécution) | 72.9 (2022/05-G³R + LGESQL + Electra) | 85.3 (2023/04-DIN-SQL + GPT-4) | 66.92 (2024/09-ASKDATA + GPT-4O) | 70.37 (2024/08-exsl + granit-34b-code) |
| 6 | 91.8 (2019/08-X-SQL + Décodage guidé par l'exécution) | 72.4 (2022/08-RESDSQL + T5-1.1-LM100K-XL) | 83.9 (2023/07 Hindsight Chain de pensée avec GPT-4) | 66.39 (2024/08-INSIGHTS AI) | 70.26 (2024/08-INSIGHTS AI) |
| 7 | 91.4 (2021/03-SDSQL) | 72.4 (2022/05-T5-SR) | 82.3 (2023/06-C3 + Chatgpt + zéro-shot) | 66.25 (2024/05-exsl + granit-20b-code) | 70.21 (2024/07-Purple + Red + GPT-4O) |
| 8 | 91.1 (2020/12 pont) | 72.2 (2022/12-N-Best Rerrankers + Picard) | 80.8 (2023/07 Hindsight Chain de pensée avec GPT-4 et instructions) | 65,70 (2024/07-RAPAP + GEMINI) | 69.03 (2024/07-RAPAP + GEMINI) |
| 9 | 91.0 (2021/04-text2sqlgen + par exemple) | 72.1 (2021/09-S²SQL + Electra) | 79.9 (2023/02-RESDSQL-3B + NATSQ) | 65.62 (2024/07-Purple + Red + GPT-4O) | 68.87 (2024/07-BYTEBRAIN) |
| 10 | 90.5 (2020/11-seqgensql + par exemple) | 72.0 (2023/02-RESDSQL-3B + NATSQL) | 78.5 (2022/11-Sead + PQL) | 63.68 (2024/08-arcwise + gpt-4o) | 67.86 (2024/05-exsl + granit-20b-code) |
(2024-arxiv) du langage naturel à SQL: examen des systèmes de texte à SQL basés sur LLM [Papier]
(2024-arxiv) Modèle de grande langue Génération de texte améliorée à SQL: une enquête [document]
(2024-arxiv) Une enquête de NL2SQL avec des modèles de grande langue: où sommes-nous et où allons-nous? [papier] [Code]
(2024-arxiv) Une enquête sur l'utilisation de modèles de langue importants pour les tâches de texte à SQL [papier]
(2023-VLDB, CCF-A) Une enquête sur les approches d'apprentissage en profondeur pour le texte à SQL [document]
(2022-TKDE, CCF-A) Une enquête sur l'analyse du texte à SQL: concepts, méthodes et orientations futures [Papier]
(2022-Coloing, CCF-B) Avancées récentes dans le texte à SQL: une enquête sur ce que nous avons et ce que nous attendons [papier]
(2022-arxiv) Languages naturels entraînés par l'apprentissage en profondeur Conversion de la requête SQL: une enquête [document]
(2024-arxiv, aucun) Chase-SQL : Raisonnement multi-chemin et préférence Sélection des candidats optimisés dans le texte à SQL [Papier]
(2024-arXiv, aucun) E-SQL : Schéma direct liant via Enrichissement de la question en texte à-SQL [Paper] [Code]
(2024-arxiv, aucun) Distillerie : la mort du schéma liant? Texte à SQL à l'ère des modèles de langage bien exploités [Papier]
(2024-arxiv, aucun) DB-GPT-HUB : Vers une analyse d'analyse comparative ouverte, habilitée par des modèles de langues grands [Paper] [Code]
(2024-arxiv, aucun) Supersql : L'aube du langage naturel à SQL: sommes-nous pleinement prêts? [papier] [Code]
(2024-arxiv, aucun) Chess : exploitation contextuelle pour une synthèse SQL efficace [papier] [Code]
(2023-arxiv, aucun) Mac-SQL : un cadre collaboratif multi-agent pour le texte à SQL [Paper] [Code]
(2023-arxiv, aucun) DBCᴏᴘɪʟᴏᴛ : mise à l'échelle du langage naturel interrogeant dans des bases de données massives [papier] [Code]
(2023-arxiv, aucun) Texte à SQL responsable par les modèles de grande langue: une évaluation de référence [Papier] [Code]
(2023-AAAI 2023, CCF-A) RESCSQL : Schéma de découplage liant et analyse du squelette pour le texte à SQL [Paper] [Code]
(2023-arxiv, aucun) LLM peut déjà servir d'interface de base de données? Un grand banc pour la base de données à grande échelle fondée sur le texte à SQL [Paper] [Code]
(2023-arxiv, aucun) DIN-SQL : Apprentissage en contexte en décomposition du texte à SQL avec auto-correction [Paper] [Code]
(2023-arxiv, aucun) Une évaluation complète de la capacité de texte à tir zéro de Chatgpt [Paper] [Code]
(2023-ICLR, CCF-A) Modèles de langage de liaison dans les langages symboliques [Paper] [Code]
(2023-Sigmod, CCF-A) Traduction de texte à SQL à quelques coups à l'aide de la structure et de l'apprentissage de l'invite de contenu [Paper] [Code]
(2023-ICASSP, CCF-B) T5-SR : Une stratégie de décodage SEQ à seq unifiée pour l'analyse sémantique [papier]
(2022-ACL, CCF-A) S 2 SQL : Injection de syntaxe à interaction d'interaction de questions pour les analyseurs de texte à SQL [Paper]
(2022-NAACL, CCF-B) SEAD : Génération de texte à SQL de fin
(2022-DENCLP, CCF-B) Star : pré-formation guidée SQL pour l'analyse de texte à SQL dépendante du contexte [Paper] [Code]
(2022-ENMLLP, CCF-B) RASAT : Intégration des structures relationnelles dans le modèle SEQ2SEQ pré-élaboré pour le texte à SQL [Paper] [Code]
(2022-DENCLP, CCF-B) CQR-SQL : Question conversationnelle Reformulation Amélioration des analyseurs de texte à SQL dépendants du contexte [Papier] [Papier]
(2022-ACL, CCF-A) HIE-SQL : Réseau amélioré des informations d'historique pour l'analyse sémantique sémantique de texte à SQL dépendante du contexte [papier]
(2022-arxiv, aucun) Importance de synthétiser des données de haute qualité pour l'analyse de texte à SQL [papier]
(2021-ACL, CCF-A) Modélisation du dialogue découplé et analyse sémantique pour le texte à plusieurs tours de tour
(2021-arxiv, aucun) accorde plus d'attention à l'historique: une stratégie de modélisation de contexte pour le texte conversationnel à SQL [Papier] [Code]
(2021-ICLR, CCF-A) : pré-formation pour la représentation de contexte dans l'analyse sémantique conversationnelle [papier]
(2021-DASFAA, CCF-B) Une approche interactive NL2SQL avec stratégie de réutilisation [Papier]
(2021-NAACL, CCF-B) Presting-ying à la structure pour le texte à SQL [papier]
(2021-DENCLP, CCF-B) Picard : analyse progressivement pour le décodage auto-régressif contraint à partir de modèles de langue [Paper] [Code]
(2021-ICLR, CCF-A) Grappa : pré-formation de grammaire pour la table sémantique de table [Paper] [Code]
(2021-ACL, CCF-A) LGESQL : Modèle de texte amélioré en ligne avec des relations locales et non locales mixtes [Papier] [Code]
(2020-DENCLP, CCF-B) Bridging Textual and Tabular Data for Cross-Domain Text-to-SQL Analyse sémantique [Paper] [Code]
(2020-ACL, CCF-A) Tabert : pré-formation pour la compréhension conjointe des données textuelles et tabulaires [papier] [Code]
(2020-ACL, CCF-A) Rat-SQL : Schéma Aware Encoding et lien pour les analyseurs de texte à SQL [Paper] [Code]
(2020-SENLP, CCF-B) Mentionnez l'extraction et le lien pour la génération de requêtes SQL [Paper]
(2020-DENCLP, CCF-B) IGSQL : modèle neuronal basé sur le schéma de schéma de base de données pour la génération de texte à SQL dépendante du contexte [Code] [Code]
(2020-arxiv, non) Réseau de classement hybride pour le texte à SQL [Paper] [Code]
(2019-arxiv, aucun) X-SQL : renforcez la représentation du schéma avec le contexte [papier]
(2019-DENCLP, CCF-B) Raisonnement global sur les structures de base de données pour l'analyse de texte à SQL [Papier] [Code]
(2019-DENSLP, CCF-B) Génération de requête SQL basée sur l'édition pour les questions dépendantes du contexte inter-domaine [Papier] [Code]
(2019-ACL, CCF-A) représentant la structure du schéma avec des réseaux de neurones graphiques pour l'analyse de texte à SQL [Paper] [Code]
(2019-ACL, CCF-A) vers un texte à SQL complexe dans la base de données inter-domaines avec représentation intermédiaire [Paper] [Code]
(2018-DENCLP, CCF-B) SyntaxSQLNET : Réseaux d'arbres de syntaxe pour la tâche complexe et inter-domaintext-to-sql [Paper] [Code]
(2018-NAACL, CCF-B) TypesQL : Génération de texte neuronale basée sur le type basé sur les connaissances [Papier] [Code]
(2017-arXiv, None) SQLNET : Génération de requêtes structurées à partir du langage naturel sans apprentissage de renforcement [Papier] [Code]
Lama [papier] [code] [modèle]
Chatglm [papier] [code] [modèle]
Alpaca [papier] [code] [modèle]
Vicuna [papier] [code] [modèle]
Wizardlm [papier] [code] [modèle]
FALCON [PAPER] [CODE] [Modèle]
Chatglm2 [papier] [code] [modèle]
Baichuan-7b [code] [modèle]
Baichuan-13b [code] [modèle]
Interlm [papier] [code] [modèle]
LLAMA 2 [PAPER] [CODE] [Modèle]
Code Llama [Paper] [Code] [Modèle]
Qwen [papier] [code] [modèle]
Baichuan 2 [papier] [code] [modèle]
Phi-1.5 [papier] [modèle]
Mistral-7b [papier] [Code] [modèle]
Deepseek [papier] [Code] [modèle]
MINICPM [PAPER] [CODE] [Modèle]
Mixtral-8x22b [papier] [code] [modèle]
PHI-3 [papier] [modèle]
LLAMA 3 [PAPER] [CODE] [Modèle]
Qwen-1.5-110b [papier] [code] [modèle]
Qwen2 [papier] [code] [modèle]
LLAMA 3.1 [PAPER] [CODE] [Modèle]
Qwen2.5 [papier] [code] [modèle]
Lama 3.2 [papier] [Code] [modèle]
P-Tuning [Paper] [Code]
Lora [papier] [code]
P-Tuning v2 [papier] [Code]
Rlhf [papier] [code]
Rrhf [papier] [code]
Qlora [papier] [Code]
Rltf [papier] [code]
Rrtf [papier]
Rlaif [papier]
Wikisql [papier] [code] [ensemble de données]
Spider 1.0 [papier] [Code] [ensemble de données]
Sparc [papier] [code] [ensemble de données]
Cspider [papier] [code] [ensemble de données]
Cosql [papier] [code] [ensemble de données]
TableQa [papier] [ensemble de données]
Dusql [papier] [ensemble de données]
Kaggledbqa [papier] [code] [ensemble de données]
Chase [papier] [code] [ensemble de données]
Bird-SQL [Paper] [Code] [ensemble de données]
Bird-SQL Mini-DEV [Paper] [Code] [ensemble de données]
Spider 2.0 [papier] [Code] [ensemble de données]
Précision d'exécution (ex) [papier]
Correspondance exacte (em) [papier]
MINDSQL
Premsql
Db-gpt-hub
sqlcoder
modal_finetune_sql
Tun-économe en lama
Si vous trouvez Text2SQL utile pour vos recherches ou développement, veuillez citer l'article suivant:
@misc { zhou2024dbgpthub ,
title = { DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models } ,
author = { Fan Zhou and Siqiao Xue and Danrui Qi and Wenhui Shi and Wang Zhao and Ganglin Wei and Hongyang Zhang and Caigai Jiang and Gangwei Jiang and Zhixuan Chu and Faqiang Chen } ,
year = { 2024 } ,
eprint = { 2406.11434 } ,
archivePrefix = { arXiv } ,
primaryClass = { id='cs.DB' full_name='Databases' is_active=True alt_name=None in_archive='cs' is_general=False description='Covers database management, datamining, and data processing. Roughly includes material in ACM Subject Classes E.2, E.5, H.0, H.2, and J.1.' }
}éosphore
Génial-aigc-tutorial