英語|中文版|紙
用於大型語言模型的策劃教程和資源,Text2SQL,Text2DSL,Text2API,Text2Vis等。
我們非常歡迎所有人的貢獻,無論您找到了錯字,錯誤,建議還是想共享與LLM+Text2SQL有關的資源。有關如何貢獻的詳細指南,請參閱我們的contruting.md文件。
| Wikisql | 蜘蛛 確切匹配(EM) | 蜘蛛 確切執行(EX) | 鳥 基於獎勵的有效效率得分(R-VES) | 鳥 執行準確性(EX) | |
|---|---|---|---|---|---|
| 1 | 93.0 (2021/05-SEAD+執行指導解碼) | 81.5 (2023/11-Miniseek) | 91.2 (2023/11-Miniseek) | 69.36 (2024/08-opensearch-SQL,V2 + GPT-4O) | 73.00 (2024/09-chase-sql + gemini) |
| 2 | 92.7 (2021/03-SDSQL+執行指導解碼) | 74.0 (2022/09-graphix-3b + picard) | 86.6 (2023/08-Dail-SQL + GPT-4 +自穩定性) | 68.79 (2024/08-EXSL + Granite-34b-Code) | 72.39 (2024/09-assdata + gpt-4O) |
| 3 | 92.5 (2020/11-ie-SQL+執行指導解碼) | 73.9 (2022/09-catsql + grappa) | 86.2 (2023/08-Dail-SQL + GPT-4) | 68.44 (2024/09-chase-sql + gemini) | 72.28 (2024/08-opensearch-SQL,V2 + GPT-4O) |
| 4 | 92.2 (2020/03-Hydranet+執行指導解碼) | 73.1 (2022/09-SHIP + PICARD) | 85.6 (2023/10-DPG-SQL + GPT-4 +自校正) | 67.41 (2024/07-Distillery + GPT-4O) | 71.83 (2024/07-Distillery + GPT-4O) |
| 5 | 91.9 (2020/12橋+執行指導解碼) | 72.9 (2022/05-G³R + LGESQL + Electra) | 85.3 (2023/04-DIN-SQL + GPT-4) | 66.92 (2024/09-assdata + gpt-4O) | 70.37 (2024/08-EXSL + Granite-34b-Code) |
| 6 | 91.8 (2019/08-X-SQL+執行指導解碼) | 72.4 (2022/08-Resdsql+T5-1.1-LM100K-XL) | 83.9 (2023/07-Hindsight thing th Gpt-4的思想鏈) | 66.39 (2024/08-Inglights AI) | 70.26 (2024/08-Inglights AI) |
| 7 | 91.4 (2021/03-SDSQL) | 72.4 (2022/05-T5-SR) | 82.3 (2023/06-C3 + CHATGPT +零射) | 66.25 (2024/05-EXSL + Granite-20b代碼) | 70.21 (2024/07-Purple +紅色 + GPT-4O) |
| 8 | 91.1 (2020/12橋) | 72.2 (2022/12-N-最佳列表rerankers + picard) | 80.8 (2023/07-HINDSIGHT與GPT-4和說明的思想鏈) | 65.70 (2024/07-Recap + Gemini) | 69.03 (2024/07-Recap + Gemini) |
| 9 | 91.0 (2021/04-Text2Sqlgen + EG) | 72.1 (2021/09-S²SQL + Electra) | 79.9 (2023/02-Resdsql-3b + Natsq) | 65.62 (2024/07-Purple +紅色 + GPT-4O) | 68.87 (2024/07-BYTEBRAIN) |
| 10 | 90.5 (2020/11-seqgensql+eg) | 72.0 (2023/02-Resdsql-3b + Natsql) | 78.5 (2022/11-SEAD + PQL) | 63.68 (2024/08-Arcwise + GPT-4O) | 67.86 (2024/05-EXSL + Granite-20b代碼) |
(2024-ARXIV)從自然語言到SQL:基於LLM的文本到SQL系統的評論[Paper]
(2024-ARXIV)大語言模型增強了文本到SQL的生成:調查[論文]
(2024-ARXIV)對NL2SQL的調查,具有大型語言模型:我們在哪裡,我們要去哪裡? [紙] [代碼]
(2024-ARXIV)一項關於使用大型語言模型進行文本到SQL任務的調查[紙]
(2023-VLDB,CCF-A)一項關於文本到SQL深度學習方法的調查[紙]
(2022-TKDE,CCF-A)一項關於文本到SQL解析的調查:概念,方法和未來方向[論文]
(2022-COLOING,CCF-B)文本到SQL的最新進展:對我們擁有的和期望的調查[論文]
(2022-ARXIV)深度學習驅動的自然語言文本SQL查詢轉換:調查[論文]
(2024-ARXIV,NONE) CHASE-SQL :多路推理和偏好優化的候選候選者在文本到SQL [Paper]中的選擇
(2024-arxiv,無) e-sql :直接架構通過質量富集在文本到sql [paper] [code]中鏈接
(2024-ARXIV,NONE)釀酒廠:架構鏈接的死亡?在良好的語言模型時代的文本到SQL [論文]
(2024-ARXIV,NONE) DB-GPT-HUB :開放基準測試文本到SQL,由大語言模型[Paper] [Code]授予SQL
(2024-arxiv,無) SuperSQL :自然語言降至SQL:我們已經準備好了嗎? [紙] [代碼]
(2024-arxiv,無)國際象棋:上下文利用有效的SQL合成[Paper] [代碼]
(2023-arxiv,無) MAC-SQL :用於文本到SQL的多代理協作框架[Paper] [代碼]
(2023-ARXIV,NONE) DBCᴏᴘɪʟᴏᴛ :將自然語言查詢縮放到大量數據庫[Paper] [代碼]
(2023-arxiv,無)大語模型授權的文本到SQL:基準評估[Paper] [代碼]
(2023-AAAI 2023,CCF-A) resdsql :解耦模式鏈接和骨架解析文本到SQL [Paper] [code] [代碼]
(2023-arxiv,無)LLM可以用作數據庫接口嗎?大規模數據庫接地文本到sqls [paper] [code]的大台
(2023-ARXIV,NONE) DIN-SQL :用自我糾正[paper] [code]分解文本到sql的文本到sql
(2023-ARXIV,無)對Chatgpt的零擊文本到SQL功能的全面評估[Paper] [代碼]
(2023-ICLR,CCF-A)符號語言中的綁定語言模型[paper] [代碼]
(2023-sigmod,ccf-a)使用結構和內容提示學習[paper] [code]幾乎沒有射擊的文本到SQL翻譯
(2023-ICASSP,CCF-B) T5-SR :用於語義解析的統一SEQ-to-seq解碼策略[紙]
(2022-ACL,CCF-A) S 2 SQL :將語法注入Question-Schema交互作用圖編碼器,用於文本到SQL Parsers [Paper]
(2022-NAACL,CCF-B) SEAD :端到端文本到SQL生成,帶有模式感知的Denoising [Paper]
(2022-emnlp,CCF-B) Star :SQL指導培訓,用於上下文依賴於文本到SQL解析[Paper] [Code]
(2022-emnlp,ccf-b) RASAT :將關係結構集成到文本到SQL [Paper] [Paper] [Code]的驗證的SEQ2SEQ模型中
(2022-emnlp,ccf-b) CQR-SQL :對話問題重新制定增強了上下文依賴性文本到SQL解析器[紙]
(2022-ACL,CCF-A) HIE-SQL :歷史信息增強網絡,用於上下文依賴於文本到SQL語義解析[Paper]
(2022-ARXIV,無)合成高質量數據以進行文本到SQL解析的重要性[Paper]
(2021-ACL,CCF-A)對話建模和語義解析,用於多轉文本到SQL [Paper]
(2021-ARXIV,NONE)更多地關注歷史:對話式文本到SQL的上下文建模策略[paper] [code]
(2021-ICLR,CCF-A)得分:對會話語義解析的上下文表示的預訓練[紙]
(2021-DASFAA,CCF-B)與重用策略的交互式NL2SQL方法[紙]
(2021-NAACL,CCF-B)文本到SQL的結構構建預處理[紙]
(2021-ENMLP,CCF-B) PICARD :從語言模型[Paper] [Code]的受約束自動回歸解碼的逐步解析。
(2021-ICLR,CCF-A) grappa :語法上的餐桌語義解析預訓練[paper] [code]
(2021-ACL,CCF-A) LGESQL :線圖增強了具有混合本地和非本地關係的文本到SQL模型[Paper] [Code]
(2020-ENMLP,CCF-B)跨域文本到SQL語義解析的橋接文本和表格數據[paper] [代碼]
(2020-ACL,CCF-A) TABERT :仔細研究文本和表格數據的聯合理解[paper] [code]
(2020-ACL,CCF-A) rat-sql :與文本到SQL Parsers [Paper] [CODE]的關係含義的架構編碼和鏈接
(2020-ENMLP,CCF-B)提取SQL查詢生成的提取和鏈接[Paper]
(2020-ENMLP,CCF-B) IGSQL :基於數據庫架構相互作用圖的神經模型,用於上下文依賴的文本到SQL生成[Paper] [code] [code]
(2020-ARXIV,NONE)文本到SQL的混合排名網絡[Paper] [代碼]
(2019-ARXIV,無) X-SQL :帶有上下文的增強架構表示[論文]
(2019-ENMLP,CCF-B)用於文本到SQL解析的數據庫結構的全局推理[Paper] [代碼]
(2019-ENMLP,CCF-B)基於編輯的SQL查詢生成,用於跨域上下文依賴性問題[paper] [代碼]
(2019-ACL,CCF-A)用圖形神經網絡代表架構結構,用於文本到SQL解析[paper] [code]
(2019-ACL,CCF-A)朝著具有中間表示的跨域數據庫中的複雜文本到SQL [paper] [代碼]
(2018- eMnlp,ccf-b)語法:複雜和交叉銷售to-sql任務的語法樹網絡[paper] [code] [code]
(2018-NAACL,CCF-B) TypesQL :基於知識的類型感知神經文本到SQL生成[Paper] [CODE] [代碼]
(2017-亞克薩維克,無) SQLNET :在沒有強化學習的情況下從自然語言中生成結構化查詢[論文] [代碼]
駱駝[紙] [代碼] [模型]
chatglm [paper] [代碼] [模型]
羊駝[紙] [代碼] [模型]
Vicuna [Paper] [代碼] [模型]
wizardlm [paper] [代碼] [模型]
獵鷹[紙] [代碼] [模型]
chatglm2 [paper] [代碼] [模型]
Baichuan-7b [代碼] [模型]
Baichuan-13b [代碼] [模型]
Internlm [Paper] [Code] [模型]
Llama 2 [Paper] [代碼] [模型]
代碼駱駝[Paper] [代碼] [模型]
qwen [paper] [代碼] [模型]
Baichuan 2 [Paper] [代碼] [模型]
PHI-1.5 [紙] [模型]
Mistral-7b [Paper] [代碼] [模型]
DeepSeek [Paper] [代碼] [模型]
minicpm [paper] [代碼] [模型]
Mixtral-8x22b [Paper] [Code] [模型]
PHI-3 [紙] [模型]
駱駝3 [紙] [代碼] [模型]
Qwen-1.5-110b [Paper] [Code] [模型]
qwen2 [paper] [代碼] [模型]
Llama 3.1 [Paper] [代碼] [模型]
qwen2.5 [paper] [代碼] [模型]
Llama 3.2 [Paper] [代碼] [模型]
p-Tuning [Paper] [代碼]
洛拉[紙] [代碼]
p-Tuning V2 [Paper] [代碼]
RLHF [Paper] [代碼]
RRHF [Paper] [代碼]
Qlora [Paper] [代碼]
RLTF [Paper] [代碼]
RRTF [紙]
rlaif [紙]
wikisql [paper] [代碼] [數據集]
蜘蛛1.0 [紙] [代碼] [數據集]
sparc [paper] [code] [數據集]
Cspider [Paper] [Code] [DataSet]
cosql [paper] [code] [數據集]
tableqa [paper] [數據集]
dusql [paper] [數據集]
kaggledbqa [paper] [code] [dataset]
追逐[紙] [代碼] [數據集]
鳥 - sql [paper] [代碼] [數據集]
Bird-SQL Mini-Dev [Paper] [代碼] [數據集]
蜘蛛2.0 [紙] [代碼] [數據集]
執行準確性(EX)[紙]
確切匹配(EM)[紙]
Mindsql
PREMSQL
DB-GPT-HUB
sqlcoder
modal_finetune_sql
駱駝效率調節
如果您發現Text2SQL對您的研究或開發有用,請引用以下論文:
@misc { zhou2024dbgpthub ,
title = { DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models } ,
author = { Fan Zhou and Siqiao Xue and Danrui Qi and Wenhui Shi and Wang Zhao and Ganglin Wei and Hongyang Zhang and Caigai Jiang and Gangwei Jiang and Zhixuan Chu and Faqiang Chen } ,
year = { 2024 } ,
eprint = { 2406.11434 } ,
archivePrefix = { arXiv } ,
primaryClass = { id='cs.DB' full_name='Databases' is_active=True alt_name=None in_archive='cs' is_general=False description='Covers database management, datamining, and data processing. Roughly includes material in ACM Subject Classes E.2, E.5, H.0, H.2, and J.1.' }
}Eosphoros
很棒的AIGC教程