ภาษาอังกฤษ |中文版| กระดาษ
บทช่วยสอนและทรัพยากรสำหรับแบบจำลองภาษาขนาดใหญ่ Text2SQL, Text2DSL, Text2API, Text2VIS และอื่น ๆ
เรายินดีต้อนรับการมีส่วนร่วมอย่างอบอุ่นจากทุกคนไม่ว่าคุณจะพบการพิมพ์ผิดบั๊กมีข้อเสนอแนะหรือต้องการแบ่งปันทรัพยากรที่เกี่ยวข้องกับ LLM+Text2SQL สำหรับแนวทางโดยละเอียดเกี่ยวกับวิธีการมีส่วนร่วมโปรดดูไฟล์ MD ที่มีส่วนร่วมของเรา
| Wikisql | แมงมุม การจับคู่ที่แน่นอน (EM) | แมงมุม การดำเนินการที่แน่นอน (เช่น) | นก คะแนนประสิทธิภาพที่ถูกต้องตามรางวัล (R-VES) | นก ความแม่นยำในการดำเนินการ (EX) | |
|---|---|---|---|---|---|
| 1 | 93.0 (2021/05-SEAD+DECODING-GUADED-DECODING) | 81.5 (2023/11 มินิส) | 91.2 (2023/11 มินิส) | 69.36 (2024/08-OpenSearch-SQL, V2 + GPT-4O) | 73.00 (2024/09-Chase-SQL + GEMINI) |
| ? 2 | 92.7 (2021/03-SDSQL+การถอดรหัสนำทางการดำเนินการ)) | 74.0 (2022/09-Graphix-3b + Picard) | 86.6 (2023/08-Dail-SQL + GPT-4 + ความสม่ำเสมอ) | 68.79 (2024/08-EXSL + GRANITE-34B-CODE) | 72.39 (2024/09-askdata + GPT-4O) |
| ? 3 | 92.5 (2020/11-IE-SQL+Decoding-Guided-Guided-Guided Decoding) | 73.9 (2022/09-Catsql + Grappa) | 86.2 (2023/08-dail-SQL + GPT-4) | 68.44 (2024/09-Chase-SQL + GEMINI) | 72.28 (2024/08-OpenSearch-SQL, V2 + GPT-4O) |
| 4 | 92.2 (2020/03-Hydranet+Decoding-Guiding-Guided Decoding) | 73.1 (2022/09-Ship + Picard) | 85.6 (2023/10-DPG-SQL + GPT-4 + การแก้ไขตนเอง) | 67.41 (2024/07-Distillery + GPT-4O) | 71.83 (2024/07-Distillery + GPT-4O) |
| 5 | 91.9 (2020/12-Bridge+Decoding-Guiding-Guided Decoding) | 72.9 (2022/05-g³r + LGESQL + ELECTRA) | 85.3 (2023/04-DIN-SQL + GPT-4) | 66.92 (2024/09-askdata + GPT-4O) | 70.37 (2024/08-EXSL + GRANITE-34B-CODE) |
| 6 | 91.8 (2019/08-X-SQL+Decoding-Guiding-Guided Decoding) | 72.4 (2022/08-RESDSQL+T5-1.1-LM100K-XL) | 83.9 (2023/07-Hindsight Chain of Thought ด้วย GPT-4) | 66.39 (2024/08-Insights AI) | 70.26 (2024/08-Insights AI) |
| 7 | 91.4 (2021/03-SDSQL) | 72.4 (2022/05-T5-SR) | 82.3 (2023/06-C3 + chatgpt + zero-shot) | 66.25 (2024/05-EXSL + GRANITE-20B-CODE) | 70.21 (2024/07-PURPLE + RED + GPT-4O) |
| 8 | 91.1 (2020/12-bridge) | 72.2 (2022/12-N-Best List Rerankers + Picard) | 80.8 (2023/07-Hindsight Chain of Thought ด้วย GPT-4 และคำแนะนำ) | 65.70 (2024/07-Recap + Gemini) | 69.03 (2024/07-Recap + Gemini) |
| 9 | 91.0 (2021/04-text2sqlgen + EG) | 72.1 (2021/09-s²sql + Electra) | 79.9 (2023/02-RESDSQL-3B + NATSQ) | 65.62 (2024/07-PURPLE + RED + GPT-4O) | 68.87 (2024/07-bytebrain) |
| 10 | 90.5 (2020/11-seqgensql+eg) | 72.0 (2023/02-RESDSQL-3B + NATSQL) | 78.5 (2022/11-sead + PQL) | 63.68 (2024/08-arcwise + GPT-4O) | 67.86 (2024/05-EXSL + GRANITE-20B-CODE) |
(2024-arxiv) จากภาษาธรรมชาติถึง SQL: การทบทวนระบบข้อความกับ SQL แบบ LLM [กระดาษ]
(2024-arxiv) รูปแบบภาษาขนาดใหญ่ปรับปรุงการสร้างข้อความถึง SQL: การสำรวจ [กระดาษ]
(2024-Arxiv) การสำรวจ NL2SQL ด้วยแบบจำลองภาษาขนาดใหญ่: เราอยู่ที่ไหนและเราจะไปที่ไหน? [กระดาษ] [รหัส]
(2024-Arxiv) การสำรวจเกี่ยวกับการใช้แบบจำลองภาษาขนาดใหญ่สำหรับงานแบบข้อความถึง SQL [PAPER]
(2023-VLDB, CCF-A) การสำรวจวิธีการเรียนรู้เชิงลึกสำหรับข้อความถึง SQL [กระดาษ]
(2022-TKDE, CCF-A) การสำรวจการแยกวิเคราะห์แบบข้อความถึง SQL: แนวคิดวิธีการและทิศทางในอนาคต [กระดาษ]
(2022-Coloing, CCF-B) ความก้าวหน้าล่าสุดในข้อความถึง SQL: การสำรวจสิ่งที่เรามีและสิ่งที่เราคาดหวัง [กระดาษ]
(2022-Arxiv) ข้อความภาษาธรรมชาติที่ขับเคลื่อนด้วยการเรียนรู้อย่างลึก
(2024-arxiv, ไม่มี) Chase-SQL : การใช้เหตุผลหลายเส้นทางและการเลือกผู้สมัครที่ได้รับการปรับให้เหมาะสมที่สุดในข้อความถึง SQL [กระดาษ]
(2024-arxiv, ไม่มี) e-SQL : การเชื่อมโยงสคีโดยตรงโดยตรงผ่านการเพิ่มคำถามในข้อความถึง SQL [กระดาษ] [รหัส]
(2024-Arxiv, ไม่มี) โรงกลั่น : การตายของสคีมาเชื่อมโยง? Text-to-sql ในยุคของแบบจำลองภาษาที่มีเหตุผลอย่างดี [Paper]
(2024-arxiv, ไม่มี) DB-GPT-Hub : ไปสู่การเปิดการเปรียบเทียบแบบเปิด text-to-SQL ได้รับพลังจากโมเดลภาษาขนาดใหญ่ [กระดาษ] [รหัส]
(2024-Arxiv, ไม่มี) SuperSQL : รุ่งอรุณของภาษาธรรมชาติถึง SQL: เราพร้อมหรือยัง? [กระดาษ] [รหัส]
(2024-Arxiv, ไม่มี) หมากรุก : การควบคุมบริบทสำหรับการสังเคราะห์ SQL ที่มีประสิทธิภาพ [กระดาษ] [รหัส]
(2023-arxiv, ไม่มี) MAC-SQL : กรอบการทำงานร่วมกันแบบหลายตัวแทนสำหรับข้อความถึง SQL [กระดาษ] [รหัส]
(2023-arxiv, ไม่มี) DBCᴏᴘɪʟᴏᴛ : การปรับขนาดภาษาธรรมชาติสืบค้นไปยังฐานข้อมูลขนาดใหญ่ [กระดาษ] [รหัส]
(2023-arxiv, ไม่มี) ข้อความถึง SQL ได้รับพลังจากแบบจำลองภาษาขนาดใหญ่: การประเมินเกณฑ์มาตรฐาน [กระดาษ] [รหัส]
(2023-AAAI 2023, CCF-A) ResdSQL : การเชื่อมโยงสคีมา Decoupling และการวิเคราะห์โครงกระดูกสำหรับข้อความถึง SQL [กระดาษ] [รหัส]
(2023-arxiv, ไม่มี) LLM สามารถทำหน้าที่เป็นอินเทอร์เฟซฐานข้อมูลได้หรือไม่? ม้านั่งขนาดใหญ่สำหรับฐานข้อมูลขนาดใหญ่ที่มีสายข้อความถึง SQLS [Paper] [Code]
(2023-arxiv, ไม่มี) DIN-SQL : ย่อยสลายการเรียนรู้ในบริบทของข้อความถึง SQL ด้วยการแก้ไขตนเอง [กระดาษ] [รหัส]
(2023-arxiv, ไม่มี) การประเมินที่ครอบคลุมเกี่ยวกับความสามารถในการส่งข้อความแบบ searer-shot to-sql ของ Chatgpt [Paper] [Code]
(2023-ICLR, CCF-A) แบบจำลองภาษาที่มีผลผูกพันในภาษาสัญลักษณ์ [กระดาษ] [รหัส]
(2023-SIGMOD, CCF-A) การแปลแบบ text-sql แบบ sql ไม่กี่แบบโดยใช้โครงสร้างและการเรียนรู้ที่รวดเร็วของเนื้อหา [กระดาษ] [รหัส]
(2023-ICASSP, CCF-B) T5-SR : กลยุทธ์การถอดรหัส SEQ-to-Seq แบบครบวงจรสำหรับการแยกวิเคราะห์ความหมาย [กระดาษ]
(2022-ACL, CCF-A) S 2 SQL : การฉีดไวยากรณ์ไปยังกราฟการโต้ตอบแบบอินเตอร์แอคทีฟคำถามสำหรับตัวแยกวิเคราะห์แบบข้อความถึง SQL [กระดาษ]
(2022-NAACL, CCF-B) SEAD : การสร้างข้อความถึงแบบ end-to-end ด้วยการ denoising Schema-Aware [Paper]
(2022-ENDENLP, CCF-B) Star : SQL Guided Pre-Training สำหรับการแยกวิเคราะห์แบบ text-to-SQL ที่ขึ้นกับบริบท [กระดาษ] [รหัส]
(2022-ENDENLP, CCF-B) RASAT : การรวมโครงสร้างเชิงสัมพันธ์เข้ากับโมเดล SEQ2SEQ ที่ผ่านการฝึกฝนไว้สำหรับข้อความถึง SQL [PAPER] [CODE]
(2022-ENDENLP, CCF-B) CQR-SQL : การปรับคำถามการสนทนาการปรับเปลี่ยนการปรับเปลี่ยนข้อความที่ขึ้นอยู่กับบริบทเป็นตัวแยกวิเคราะห์แบบ te-to-SQL [PAPER]
(2022-ACL, CCF-A) HIE-SQL : ข้อมูลประวัติเครือข่ายที่ปรับปรุงแล้วสำหรับการแยกวิเคราะห์ความหมายแบบ text-to-SQL ที่ขึ้นกับบริบท [กระดาษ]
(2022-arxiv, ไม่มี) ความสำคัญของการสังเคราะห์ข้อมูลคุณภาพสูงสำหรับการแยกวิเคราะห์ข้อความถึง SQL [กระดาษ]
(2021-ACL, CCF-A) การสร้างแบบจำลองบทสนทนาและการแยกวิเคราะห์ความหมายสำหรับหลายครั้งที่ส่งข้อความถึง SQL [กระดาษ]
(2021-arxiv, ไม่มี) ให้ความสนใจกับประวัติศาสตร์มากขึ้น: กลยุทธ์การสร้างแบบจำลองบริบทสำหรับการสนทนา text-to-sql [paper] [รหัส]
(2021-ICLR, CCF-A) คะแนน : การฝึกอบรมล่วงหน้าสำหรับการเป็นตัวแทนบริบทในการแยกความหมายของการสนทนา [กระดาษ]
(2021-DASFAA, CCF-B) วิธีการแบบโต้ตอบ NL2SQL ด้วยกลยุทธ์การใช้ซ้ำ [กระดาษ]
(2021-NAACL, CCF-B) การเตรียมโครงสร้างแบบพื้นดินสำหรับข้อความถึง SQL [กระดาษ]
(2021-ENDENLP, CCF-B) Picard : การแยกวิเคราะห์เพิ่มขึ้นสำหรับการถอดรหัสการรับรู้แบบอัตโนมัติแบบเร่งรัดจากแบบจำลองภาษา [กระดาษ] [รหัส]
(2021-ICLR, CCF-A) Grappa : การฝึกอบรมก่อนการฝึกไวยากรณ์สำหรับการแยกความหมายของตาราง [กระดาษ] [รหัส]
(2021-ACL, CCF-A) LGESQL : กราฟบรรทัดปรับปรุงโมเดลข้อความถึง SQL ที่มีความสัมพันธ์แบบผสมในท้องถิ่นและไม่ใช่ท้องถิ่น [กระดาษ] [รหัส]
(2020-ENDENLP, CCF-B) เชื่อมโยงข้อมูลข้อความและตารางสำหรับการแยกวิเคราะห์ความหมายแบบข้อความข้ามโดเมนเป็น SQL [PAPER] [CODE]
(2020-ACL, CCF-A) แท็บ : การเตรียมการเพื่อความเข้าใจร่วมกันของข้อมูลที่เป็นข้อความและตาราง [กระดาษ] [รหัส]
(2020-ACL, CCF-A) Rat-SQL : การเข้ารหัสสคีมาที่รับรู้และการเชื่อมโยงสำหรับตัวแยกวิเคราะห์แบบข้อความกับ SQL [กระดาษ] [รหัส]
(2020-ENMENLP, CCF-B) พูดถึงการสกัดและการเชื่อมโยงสำหรับการสร้างแบบสอบถาม SQL [กระดาษ]
(2020-ENDENLP, CCF-B) IGSQL : รูปแบบการโต้ตอบแบบสคีมาของฐานข้อมูลกราฟตามรูปแบบระบบประสาทตามบริบทที่ขึ้นกับบริบทการสร้าง [PAPER] [CODE]
(2020-arxiv, ไม่มี) เครือข่ายการจัดอันดับไฮบริดสำหรับข้อความถึง SQL [กระดาษ] [รหัส]
(2019-arxiv, ไม่มี) X-SQL : เสริมการแสดงสคีมาด้วยบริบท [กระดาษ]
(2019-ENDENLP, CCF-B) การใช้เหตุผลทั่วโลกผ่านโครงสร้างฐานข้อมูลสำหรับการแยกวิเคราะห์แบบข้อความถึง SQL [กระดาษ] [รหัส]
(2019-ENDENLP, CCF-B) การสร้างแบบสอบถาม SQL ที่ใช้การแก้ไขสำหรับคำถามที่ขึ้นกับบริบทข้ามโดเมน [กระดาษ] [รหัส]
(2019-ACL, CCF-A) เป็นตัวแทนของโครงสร้างสคีมาด้วยเครือข่ายประสาทกราฟสำหรับการแยกวิเคราะห์แบบข้อความถึง SQL [กระดาษ] [รหัส]
(2019-ACL, CCF-A) ไปยังข้อความที่ซับซ้อน to-sql ในฐานข้อมูลข้ามโดเมนที่มีการเป็นตัวแทนระดับกลาง [กระดาษ] [รหัส]
(2018-ENDENLP, CCF-B) SyntaxsqlNet : เครือข่ายแผนผังไวยากรณ์สำหรับงานที่ซับซ้อนและข้ามโดเมนเท็กซ์-to-SQL [กระดาษ] [รหัส]
(2018-NaAcl, CCF-B) TypesQL : การสร้างข้อความที่เป็นแบบรับรู้ประเภทความรู้ที่รับรู้ถึง [กระดาษ] [รหัส] [รหัส]
(2017-Arxiv, ไม่มี) SQLNET : การสร้างแบบสอบถามที่มีโครงสร้างจากภาษาธรรมชาติโดยไม่ต้องเรียนรู้การเสริมแรง [กระดาษ] [รหัส]
llama [กระดาษ] [รหัส] [รุ่น]
chatglm [กระดาษ] [รหัส] [รุ่น]
Alpaca [Paper] [Code] [Model]
Vicuna [Paper] [Code] [Model]
Wizardlm [Paper] [Code] [Model]
Falcon [Paper] [Code] [Model]
chatglm2 [กระดาษ] [รหัส] [รุ่น]
Baichuan-7b [รหัส] [รุ่น]
Baichuan-13b [รหัส] [รุ่น]
internlm [กระดาษ] [รหัส] [รุ่น]
Llama 2 [Paper] [Code] [Model]
รหัส LLAMA [กระดาษ] [รหัส] [รุ่น]
qwen [กระดาษ] [รหัส] [รุ่น]
Baichuan 2 [Paper] [Code] [Model]
phi-1.5 [กระดาษ] [รุ่น]
MISTRAL-7B [กระดาษ] [รหัส] [รุ่น]
Deepseek [Paper] [Code] [Model]
MINICPM [กระดาษ] [รหัส] [รุ่น]
Mixtral-8x22b [กระดาษ] [รหัส] [รุ่น]
phi-3 [กระดาษ] [รุ่น]
Llama 3 [Paper] [Code] [Model]
QWEN-1.5-110B [กระดาษ] [รหัส] [รุ่น]
qwen2 [กระดาษ] [รหัส] [รุ่น]
llama 3.1 [กระดาษ] [รหัส] [รุ่น]
qwen2.5 [กระดาษ] [รหัส] [รุ่น]
llama 3.2 [กระดาษ] [รหัส] [รุ่น]
p-tuning [กระดาษ] [รหัส]
Lora [กระดาษ] [รหัส]
P-tuning v2 [กระดาษ] [รหัส]
RLHF [กระดาษ] [รหัส]
rrhf [กระดาษ] [รหัส]
Qlora [กระดาษ] [รหัส]
RLTF [กระดาษ] [รหัส]
rrtf [กระดาษ]
rlaif [กระดาษ]
wikisql [กระดาษ] [รหัส] [ชุดข้อมูล]
แมงมุม 1.0 [กระดาษ] [รหัส] [ชุดข้อมูล]
sparc [paper] [รหัส] [ชุดข้อมูล]
cspider [กระดาษ] [รหัส] [ชุดข้อมูล]
cosql [กระดาษ] [รหัส] [ชุดข้อมูล]
tableqa [กระดาษ] [ชุดข้อมูล]
dusql [กระดาษ] [ชุดข้อมูล]
Kaggledbqa [กระดาษ] [รหัส] [ชุดข้อมูล]
Chase [Paper] [Code] [ชุดข้อมูล]
Bird-SQL [กระดาษ] [รหัส] [ชุดข้อมูล]
Bird-SQL Mini-Dev [Paper] [Code] [ชุดข้อมูล]
Spider 2.0 [Paper] [Code] [ชุดข้อมูล]
ความแม่นยำในการดำเนินการ (EX) [กระดาษ]
การจับคู่ที่แน่นอน (EM) [กระดาษ]
Mindsql
premsql
DB-GPT-HUB
sqlcoder
modal_finetune_sql
การปรับแต่งลาม่า
หากคุณพบว่า Text2SQL มีประโยชน์สำหรับการวิจัยหรือพัฒนาของคุณโปรดอ้างอิงบทความต่อไปนี้:
@misc { zhou2024dbgpthub ,
title = { DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models } ,
author = { Fan Zhou and Siqiao Xue and Danrui Qi and Wenhui Shi and Wang Zhao and Ganglin Wei and Hongyang Zhang and Caigai Jiang and Gangwei Jiang and Zhixuan Chu and Faqiang Chen } ,
year = { 2024 } ,
eprint = { 2406.11434 } ,
archivePrefix = { arXiv } ,
primaryClass = { id='cs.DB' full_name='Databases' is_active=True alt_name=None in_archive='cs' is_general=False description='Covers database management, datamining, and data processing. Roughly includes material in ACM Subject Classes E.2, E.5, H.0, H.2, and J.1.' }
}ไอสฟอรี่
Awesome-aigc-tutorials