英语|中文版|纸
用于大型语言模型的策划教程和资源,Text2SQL,Text2DSL,Text2API,Text2Vis等。
我们非常欢迎所有人的贡献,无论您找到了错字,错误,建议还是想共享与LLM+Text2SQL有关的资源。有关如何贡献的详细指南,请参阅我们的contruting.md文件。
| Wikisql | 蜘蛛 确切匹配(EM) | 蜘蛛 确切执行(EX) | 鸟 基于奖励的有效效率得分(R-VES) | 鸟 执行准确性(EX) | |
|---|---|---|---|---|---|
| 1 | 93.0 (2021/05-SEAD+执行指导解码) | 81.5 (2023/11-Miniseek) | 91.2 (2023/11-Miniseek) | 69.36 (2024/08-opensearch-SQL,V2 + GPT-4O) | 73.00 (2024/09-chase-sql + gemini) |
| 2 | 92.7 (2021/03-SDSQL+执行指导解码) | 74.0 (2022/09-graphix-3b + picard) | 86.6 (2023/08-Dail-SQL + GPT-4 +自稳定性) | 68.79 (2024/08-EXSL + Granite-34b-Code) | 72.39 (2024/09-assdata + gpt-4O) |
| 3 | 92.5 (2020/11-ie-SQL+执行指导解码) | 73.9 (2022/09-catsql + grappa) | 86.2 (2023/08-Dail-SQL + GPT-4) | 68.44 (2024/09-chase-sql + gemini) | 72.28 (2024/08-opensearch-SQL,V2 + GPT-4O) |
| 4 | 92.2 (2020/03-Hydranet+执行指导解码) | 73.1 (2022/09-SHIP + PICARD) | 85.6 (2023/10-DPG-SQL + GPT-4 +自校正) | 67.41 (2024/07-Distillery + GPT-4O) | 71.83 (2024/07-Distillery + GPT-4O) |
| 5 | 91.9 (2020/12桥+执行指导解码) | 72.9 (2022/05-G³R + LGESQL + Electra) | 85.3 (2023/04-DIN-SQL + GPT-4) | 66.92 (2024/09-assdata + gpt-4O) | 70.37 (2024/08-EXSL + Granite-34b-Code) |
| 6 | 91.8 (2019/08-X-SQL+执行指导解码) | 72.4 (2022/08-Resdsql+T5-1.1-LM100K-XL) | 83.9 (2023/07-Hindsight thing th Gpt-4的思想链) | 66.39 (2024/08-Inglights AI) | 70.26 (2024/08-Inglights AI) |
| 7 | 91.4 (2021/03-SDSQL) | 72.4 (2022/05-T5-SR) | 82.3 (2023/06-C3 + CHATGPT +零射) | 66.25 (2024/05-EXSL + Granite-20b代码) | 70.21 (2024/07-Purple +红色 + GPT-4O) |
| 8 | 91.1 (2020/12桥) | 72.2 (2022/12-N-最佳列表rerankers + picard) | 80.8 (2023/07-HINDSIGHT与GPT-4和说明的思想链) | 65.70 (2024/07-Recap + Gemini) | 69.03 (2024/07-Recap + Gemini) |
| 9 | 91.0 (2021/04-Text2Sqlgen + EG) | 72.1 (2021/09-S²SQL + Electra) | 79.9 (2023/02-Resdsql-3b + Natsq) | 65.62 (2024/07-Purple +红色 + GPT-4O) | 68.87 (2024/07-BYTEBRAIN) |
| 10 | 90.5 (2020/11-seqgensql+eg) | 72.0 (2023/02-Resdsql-3b + Natsql) | 78.5 (2022/11-SEAD + PQL) | 63.68 (2024/08-Arcwise + GPT-4O) | 67.86 (2024/05-EXSL + Granite-20b代码) |
(2024-ARXIV)从自然语言到SQL:基于LLM的文本到SQL系统的评论[Paper]
(2024-ARXIV)大语言模型增强了文本到SQL的生成:调查[论文]
(2024-ARXIV)对NL2SQL的调查,具有大型语言模型:我们在哪里,我们要去哪里? [纸] [代码]
(2024-ARXIV)一项关于使用大型语言模型进行文本到SQL任务的调查[纸]
(2023-VLDB,CCF-A)一项关于文本到SQL深度学习方法的调查[纸]
(2022-TKDE,CCF-A)一项关于文本到SQL解析的调查:概念,方法和未来方向[论文]
(2022-COLOING,CCF-B)文本到SQL的最新进展:对我们拥有的和期望的调查[论文]
(2022-ARXIV)深度学习驱动的自然语言文本SQL查询转换:调查[论文]
(2024-ARXIV,NONE) CHASE-SQL :多路推理和偏好优化的候选候选者在文本到SQL [Paper]中的选择
(2024-arxiv,无) e-sql :直接架构通过质量富集在文本到sql [paper] [code]中链接
(2024-ARXIV,NONE)酿酒厂:架构链接的死亡?在良好的语言模型时代的文本到SQL [论文]
(2024-ARXIV,NONE) DB-GPT-HUB :开放基准测试文本到SQL,由大语言模型[Paper] [Code]授予SQL
(2024-arxiv,无) SuperSQL :自然语言降至SQL:我们已经准备好了吗? [纸] [代码]
(2024-arxiv,无)国际象棋:上下文利用有效的SQL合成[Paper] [代码]
(2023-arxiv,无) MAC-SQL :用于文本到SQL的多代理协作框架[Paper] [代码]
(2023-ARXIV,NONE) DBCᴏᴘɪʟᴏᴛ :将自然语言查询缩放到大量数据库[Paper] [代码]
(2023-arxiv,无)大语模型授权的文本到SQL:基准评估[Paper] [代码]
(2023-AAAI 2023,CCF-A) resdsql :解耦模式链接和骨架解析文本到SQL [Paper] [code] [代码]
(2023-arxiv,无)LLM可以用作数据库接口吗?大规模数据库接地文本到sqls [paper] [code]的大台
(2023-ARXIV,NONE) DIN-SQL :用自我纠正[paper] [code]分解文本到sql的文本到sql
(2023-ARXIV,无)对Chatgpt的零击文本到SQL功能的全面评估[Paper] [代码]
(2023-ICLR,CCF-A)符号语言中的绑定语言模型[paper] [代码]
(2023-sigmod,ccf-a)使用结构和内容提示学习[paper] [code]几乎没有射击的文本到SQL翻译
(2023-ICASSP,CCF-B) T5-SR :用于语义解析的统一SEQ-to-seq解码策略[纸]
(2022-ACL,CCF-A) S 2 SQL :将语法注入Question-Schema交互作用图编码器,用于文本到SQL Parsers [Paper]
(2022-NAACL,CCF-B) SEAD :端到端文本到SQL生成,带有模式感知的Denoising [Paper]
(2022-emnlp,CCF-B) Star :SQL指导培训,用于上下文依赖于文本到SQL解析[Paper] [Code]
(2022-emnlp,ccf-b) RASAT :将关系结构集成到文本到SQL [Paper] [Paper] [Code]的验证的SEQ2SEQ模型中
(2022-emnlp,ccf-b) CQR-SQL :对话问题重新制定增强了上下文依赖性文本到SQL解析器[纸]
(2022-ACL,CCF-A) HIE-SQL :历史信息增强网络,用于上下文依赖于文本到SQL语义解析[Paper]
(2022-ARXIV,无)合成高质量数据以进行文本到SQL解析的重要性[Paper]
(2021-ACL,CCF-A)对话建模和语义解析,用于多转文本到SQL [Paper]
(2021-ARXIV,NONE)更多地关注历史:对话式文本到SQL的上下文建模策略[paper] [code]
(2021-ICLR,CCF-A)得分:对会话语义解析的上下文表示的预训练[纸]
(2021-DASFAA,CCF-B)与重用策略的交互式NL2SQL方法[纸]
(2021-NAACL,CCF-B)文本到SQL的结构构建预处理[纸]
(2021-ENMLP,CCF-B) PICARD :从语言模型[Paper] [Code]的受约束自动回归解码的逐步解析。
(2021-ICLR,CCF-A) grappa :语法上的餐桌语义解析预训练[paper] [code]
(2021-ACL,CCF-A) LGESQL :线图增强了具有混合本地和非本地关系的文本到SQL模型[Paper] [Code]
(2020-ENMLP,CCF-B)跨域文本到SQL语义解析的桥接文本和表格数据[paper] [代码]
(2020-ACL,CCF-A) TABERT :仔细研究文本和表格数据的联合理解[paper] [code]
(2020-ACL,CCF-A) rat-sql :与文本到SQL Parsers [Paper] [CODE]的关系含义的架构编码和链接
(2020-ENMLP,CCF-B)提取SQL查询生成的提取和链接[Paper]
(2020-ENMLP,CCF-B) IGSQL :基于数据库架构相互作用图的神经模型,用于上下文依赖的文本到SQL生成[Paper] [code] [code]
(2020-ARXIV,NONE)文本到SQL的混合排名网络[Paper] [代码]
(2019-ARXIV,无) X-SQL :带有上下文的增强架构表示[论文]
(2019-ENMLP,CCF-B)用于文本到SQL解析的数据库结构的全局推理[Paper] [代码]
(2019-ENMLP,CCF-B)基于编辑的SQL查询生成,用于跨域上下文依赖性问题[paper] [代码]
(2019-ACL,CCF-A)用图形神经网络代表架构结构,用于文本到SQL解析[paper] [code]
(2019-ACL,CCF-A)朝着具有中间表示的跨域数据库中的复杂文本到SQL [paper] [代码]
(2018- eMnlp,ccf-b)语法:复杂和交叉销售to-sql任务的语法树网络[paper] [code] [code]
(2018-NAACL,CCF-B) TypesQL :基于知识的类型感知神经文本到SQL生成[Paper] [CODE] [代码]
(2017-亚克萨维克,无) SQLNET :在没有强化学习的情况下从自然语言中生成结构化查询[论文] [代码]
骆驼[纸] [代码] [模型]
chatglm [paper] [代码] [模型]
羊驼[纸] [代码] [模型]
Vicuna [Paper] [代码] [模型]
wizardlm [paper] [代码] [模型]
猎鹰[纸] [代码] [模型]
chatglm2 [paper] [代码] [模型]
Baichuan-7b [代码] [模型]
Baichuan-13b [代码] [模型]
Internlm [Paper] [Code] [模型]
Llama 2 [Paper] [代码] [模型]
代码骆驼[Paper] [代码] [模型]
qwen [paper] [代码] [模型]
Baichuan 2 [Paper] [代码] [模型]
PHI-1.5 [纸] [模型]
Mistral-7b [Paper] [代码] [模型]
DeepSeek [Paper] [代码] [模型]
minicpm [paper] [代码] [模型]
Mixtral-8x22b [Paper] [Code] [模型]
PHI-3 [纸] [模型]
骆驼3 [纸] [代码] [模型]
Qwen-1.5-110b [Paper] [Code] [模型]
qwen2 [paper] [代码] [模型]
Llama 3.1 [Paper] [代码] [模型]
qwen2.5 [paper] [代码] [模型]
Llama 3.2 [Paper] [代码] [模型]
p-Tuning [Paper] [代码]
洛拉[纸] [代码]
p-Tuning V2 [Paper] [代码]
RLHF [Paper] [代码]
RRHF [Paper] [代码]
Qlora [Paper] [代码]
RLTF [Paper] [代码]
RRTF [纸]
rlaif [纸]
wikisql [paper] [代码] [数据集]
蜘蛛1.0 [纸] [代码] [数据集]
sparc [paper] [code] [数据集]
Cspider [Paper] [Code] [DataSet]
cosql [paper] [code] [数据集]
tableqa [paper] [数据集]
dusql [paper] [数据集]
kaggledbqa [paper] [code] [dataset]
追逐[纸] [代码] [数据集]
鸟 - sql [paper] [代码] [数据集]
Bird-SQL Mini-Dev [Paper] [代码] [数据集]
蜘蛛2.0 [纸] [代码] [数据集]
执行准确性(EX)[纸]
确切匹配(EM)[纸]
Mindsql
PREMSQL
DB-GPT-HUB
sqlcoder
modal_finetune_sql
骆驼效率调节
如果您发现Text2SQL对您的研究或开发有用,请引用以下论文:
@misc { zhou2024dbgpthub ,
title = { DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models } ,
author = { Fan Zhou and Siqiao Xue and Danrui Qi and Wenhui Shi and Wang Zhao and Ganglin Wei and Hongyang Zhang and Caigai Jiang and Gangwei Jiang and Zhixuan Chu and Faqiang Chen } ,
year = { 2024 } ,
eprint = { 2406.11434 } ,
archivePrefix = { arXiv } ,
primaryClass = { id='cs.DB' full_name='Databases' is_active=True alt_name=None in_archive='cs' is_general=False description='Covers database management, datamining, and data processing. Roughly includes material in ACM Subject Classes E.2, E.5, H.0, H.2, and J.1.' }
}Eosphoros
很棒的AIGC教程