Englisch |中文版| Papier
Kuratierte Tutorials und Ressourcen für Großsprachenmodelle, Text2SQL, Text2DSL, Text2API, Text2vis und mehr.
Wir begrüßen Beiträge aller, ob Sie einen Tippfehler gefunden haben, einen Fehler, haben einen Vorschlag oder möchten eine Ressource im Zusammenhang mit LLM+Text2SQL teilen. Detaillierte Richtlinien zum Beitrag zum Beitrag finden Sie in unserer Datei mit beitragen.md.
| Wikisql | Spinne Genaue Übereinstimmung (EM) | Spinne Exakte Ausführung (Ex) | VOGEL Belohnungsbasierte gültige Effizienzbewertung (R-VEVE) | VOGEL Ausführungsgenauigkeit (Ex) | |
|---|---|---|---|---|---|
| ? 1 | 93.0 (2021/05-Sekunden+Ausführungsgeführte Dekodierung) | 81,5 (2023/11-Minuten) | 91.2 (2023/11-Minuten) | 69.36 (2024/08-OpenSearch-SQL, V2 + GPT-4O) | 73,00 (2024/09-Chase-SQL + Gemini) |
| ? 2 | 92.7 (2021/03-SDSQL+Ausführungsgeführte Dekodierung) | 74,0 (2022/09-Graphix-3b + Picard) | 86.6 (2023/08-Dail-SQL + GPT-4 + Selbstkonsistenz) | 68.79 (2024/08-EXSL + Granite-34B-Code) | 72.39 (2024/09-askdata + gpt-4o) |
| ? 3 | 92.5 (2020/11-ie-SQL+Ausführungsgeführte Dekodierung) | 73,9 (2022/09-Catsql + Grappa) | 86,2 (2023/08-Dail-SQL + GPT-4) | 68.44 (2024/09-Chase-SQL + Gemini) | 72.28 (2024/08-OpenSearch-SQL, V2 + GPT-4O) |
| 4 | 92.2 (2020/03-Hydranet+Ausführungsgeführte Dekodierung) | 73.1 (2022/09-SHIP + PICARD) | 85.6 (2023/10-DPG-SQL + GPT-4 + Selbstkorrektur) | 67.41 (2024/07-Distillerie + GPT-4O) | 71.83 (2024/07-Distillerie + GPT-4O) |
| 5 | 91.9 (2020/12-Bridge+Ausführungsgeführte Dekodierung) | 72.9 (2022/05-G³R + LGESQL + Electra) | 85.3 (2023/04-Din-SQL + GPT-4) | 66,92 (2024/09-askdata + gpt-4o) | 70,37 (2024/08-EXSL + Granite-34B-Code) |
| 6 | 91.8 (2019/08-X-SQL+Ausführungsgeführte Dekodierung) | 72.4 (2022/08-RESDSQL+T5-1.1-LM100K-XL) | 83.9 (2023/07-Hindight-Denkkette mit GPT-4) | 66.39 (2024/08-Insights AI)) | 70,26 (2024/08-Insights AI)) |
| 7 | 91.4 (2021/03-SDSQL) | 72.4 (2022/05-T5-SR) | 82.3 (2023/06-C3 + CHATGPT + Null-Shot) | 66,25 (2024/05-EXSL + Granit-20b-Code) | 70.21 (2024/07-Purpur + Rot + GPT-4O) |
| 8 | 91.1 (2020/12-Brücke) | 72.2 (2022/12-N-Best-Listen-Reranker + Picard) | 80.8 (2023/07-Hindight-Denkkette mit GPT-4 und Anweisungen) | 65.70 (2024/07-Rücknahme + Gemini) | 69.03 (2024/07-Rücknahme + Gemini) |
| 9 | 91.0 (2021/04-TEXT2SQLGEN + EG) | 72.1 (2021/09-s²sql + Electra) | 79,9 (2023/02-RESDSQL-3B + NATSQ) | 65,62 (2024/07-Purpur + Rot + GPT-4O) | 68,87 (2024/07-Bytebrain) |
| 10 | 90,5 (2020/11-Seqgensql+EG) | 72.0 (2023/02-rESDSQL-3B + NATSQL) | 78,5 (2022/11-Sekunden + PQL) | 63,68 (2024/08-Arcise + GPT-4O)) | 67,86 (2024/05-EXSL + Granit-20b-Code) |
(2024-Arxiv) von natürlicher Sprache zu SQL: Überprüfung von LLM-basierten Text-zu-SQL-Systemen [Papier]
(2024-Arxiv) Großspracher Modell erweiterte Text-zu-SQL-Erzeugung: Eine Umfrage [Papier]
(2024-Arxiv) Eine Umfrage unter NL2SQL mit großen Sprachmodellen: Wo sind wir und wohin gehen wir? [Papier] [Code]
(2024-Arxiv) Eine Umfrage zum Einsatz großer Sprachmodelle für Text-zu-SQL-Aufgaben [Papier]
(2023-VLDB, CCF-A) Eine Umfrage zu Deep-Lern-Ansätzen für Text-zu-SQL [Papier]
(2022-tkde, CCF-A) Eine Umfrage zur Text-zu-SQL-Parsen: Konzepte, Methoden und zukünftige Richtungen [Papier]
(2022-Coloing, CCF-B) Jüngste Fortschritte in Text-to-SQL: Eine Übersicht über das, was wir haben und was wir erwarten [Papier]
(2022-Arxiv) Deep Learning Driven Natural Languages Text to SQL Query Conversion: Eine Umfrage [Papier]
(2024-Arxiv, None) Chase-SQL : Multi-Pfad-Argumentation und Präferenzoptimierter Auswahl der Kandidaten in Text-zu-SQL [Papier]
(2024-Arxiv, Keine) E-SQL : Direktes Schema, das über Frageanreicherung in Text-zu-SQL [Papier] [Code] verlinkt wird, [Code]
(2024-Arxiv, keine) Brennerei : Der Tod des Schemasverbindens? Text-to-SQL im Alter der gut begründeten Sprachmodelle [Papier]
.
(2024-Arxiv, keine) Supersql : Der Morgendämmerung der natürlichen Sprache zu SQL: Sind wir voll bereit? [Papier] [Code]
(2024-Arxiv, keines) Schach : Kontextbezogene Nutzung für eine effiziente SQL-Synthese [Papier] [Code]
(2023-Arxiv, None) Mac-SQL : Ein kollaboratives Multi-Agent-Rahmen für Text-zu-SQL [Papier] [Code]
(2023-Arxiv, keine) DBCᴏᴘɪʟᴏᴛ : Skalierung der natürlichen Sprachabfrage zu massiven Datenbanken [Papier] [Code]
(2023-Arxiv, keine) Text-to-SQL-gestärkt durch Großsprachenmodelle: Eine Benchmark-Bewertung [Papier] [Code]
(2023-AAAI 2023, CCF-A) RESDSQL : Entkopplungsschema Verknüpfung und Skelett an Text-to-SQL [Papier] [Code]
(2023-Arxiv, keine) Kann LLM bereits als Datenbankschnittstelle dienen? Eine große Bank für groß angelegte Datenbank geerdet Text-to-SQLS [Papier] [Code]
.
(2023-Arxiv, keine) Eine umfassende Bewertung der Null-Shot-Text-zu-SQL-Fähigkeit von Chatgpt [Papier] [Code]
(2023-ICLR, CCF-A) Bindungssprachmodelle in symbolischen Sprachen [Papier] [Code]
(2023-Sigmod, CCF-A) Wege-Shot-Text-zu-SQL-Übersetzung unter Verwendung von Struktur und Inhaltsaufforderung zum Lernen [Papier] [Code]
(2023-ICASSP, CCF-B) T5-SR : Eine einheitliche SEQ-to-Seq-Dekodierungsstrategie für semantische Parsen [Papier]
(2022-ACL, CCF-A) S 2 SQL : Injizieren von Syntax in Frage-Schema-Interaktionsgrapherde für Text-zu-SQL-Parser [Papier]
(2022-naacl, CCF-B) SEAD : End-to-End-Text-zu-SQL-Erzeugung mit Schema-bewusstes Denoising [Papier]
(2022-EMNLP, CCF-B) STAR : SQL Guided Pre-Training für kontextabhängige Text-zu-SQL-Parsen [Papier] [Code]
(2022-EMNLP, CCF-B) RASAT : Integration von relationalen Strukturen in ein vorbereitetes SEQ2SEQ-Modell für Text-to-SQL [Papier] [Code]
(2022-EMNLP, CCF-B) CQR-SQL : Konversationsfrageberichtungsumformulierung verbesserte kontextabhängige Text-zu-SQL-Parser [Papier]
(2022-ACL, CCF-A) HIE-SQL : History Information Enhanced Network für kontextabhängige Text-zu-SQL-Semantik-Parsing [Papier]
(2022-Arxiv, keine) Bedeutung der Synthese hochwertiger Daten für die Analyse von Text zu SQL [Papier]
(2021-ACL, CCF-A) Entkoppelte Dialogmodellierung und semantisches Parsing für Multiturn-Text-zu-SQL-[Papier]
(2021-Arxiv, keine) Achten Sie mehr auf die Geschichte: Eine Kontextmodellierungsstrategie für Konversations-Text-zu-SQL [Papier] [Code]
(2021-ICLR, CCF-A) Score : Vorausbildung für die Kontextdarstellung bei der semantischen Parsing von Konversation [Papier]
(2021-dasfaa, CCF-B) Ein interaktiver NL2SQL-Ansatz mit Wiederverwendungstrategie [Papier]
(2021-naacl, CCF-B) Struktur-gegründete Vorbau für Text-zu-SQL [Papier]
(2021-EMNLP, CCF-B) PICARD : Inkrementell an Parsen für eingeschränkte automatische Decodierung aus Sprachmodellen [Papier] [Code]
(2021-ICLR, CCF-A) GRAPPA : Grammatik-ausgebildete Pre-Training für Tabellensemantische Parsen [Papier] [Code]
(2021-ACL, CCF-A) LGGEQL : Zeilendiagramm erweitertes Text-zu-SQL-Modell mit gemischten lokalen und nicht lokalen Beziehungen [Papier] [Code]
(2020-EMNLP, CCF-B) Überbrückung von Text- und Tabellendaten für Cross-Domain-Text-zu-SQL-Semantik-Parsen [Papier] [Code]
(2020-ACL, CCF-A) Tabert : Vorbereitung für das gemeinsame Verständnis von Text- und tabellarischen Daten [Papier] [Code]
(2020-ACL, CCF-A) RAT-SQL : Relation-Award-Schema-Codierung und Verknüpfung für Text-zu-SQL-Parsers [Papier] [Code]
(2020-EMNLP, CCF-B) Erwähnungsextraktion und Verknüpfung für die SQL-Abfragegenerierung [Papier]
(2020-EMNLP, CCF-B) IGSQL : Datenbankschema-Interaktionsgrafikbasierter Neuralmodell für kontextabhängige Text-zu-SQL-Generierung [Papier] [Code]
(2020-Arxiv, keine) Hybrid-Ranking-Netzwerk für Text-zu-SQL [Papier] [Code]
(2019-Arxiv, Keine) X-SQL : Verstärkung der Schema-Darstellung mit dem Kontext [Papier]
(2019-EMNLP, CCF-B) Globale Argumentation über Datenbankstrukturen für Text-to-SQL-Parsen [Papier] [Code]
(2019-EMNLP, CCF-B) Bearbeitungsbasiertes SQL-Abfragegenerierung für Cross-Domänen-Kontext-abhängige Fragen [Papier] [Code]
(2019-ACL, CCF-A) Darstellung der Schemastruktur mit Grafiknetzwerken für Text-to-SQL-Parsen [Papier] [Code]
(2019-ACL, CCF-A) in Richtung komplexer Text-zu-SQL in der Cross-Domain-Datenbank mit Zwischendarstellung [Papier] [Code]
(2018-EMNLP, CCF-B) SyntaxSQLNet : Syntax-Baumnetzwerke für komplexe und Cross-Domaintext-to-SQL-Aufgaben [Papier] [Code]
(2018-Naacl, CCF-B) TypesQL : Wissensbasierte Typ-zu-SQL-Generation vom Typ Neuraler Text zu SQL [Papier] [Code]
(2017-Arxiv, Keine) SQLNET : Generierung strukturierter Abfragen aus natürlicher Sprache ohne Verstärkungslernen [Papier] [Code]
Lama [Papier] [Code] [Modell]
Chatglm [Papier] [Code] [Modell]
Alpaka [Papier] [Code] [Modell]
Vicuna [Papier] [Code] [Modell]
WizardLM [Papier] [Code] [Modell]
Falcon [Papier] [Code] [Modell]
Chatglm2 [Papier] [Code] [Modell]
Baichuan-7b [Code] [Modell]
Baichuan-13b [Code] [Modell]
Internlm [Papier] [Code] [Modell]
LAMA 2 [Papier] [Code] [Modell]
Code Lama [Papier] [Code] [Modell]
QWEN [Papier] [Code] [Modell]
Baichuan 2 [Papier] [Code] [Modell]
PHI-1.5 [Papier] [Modell]
Mistral-7b [Papier] [Code] [Modell]
Deepseek [Papier] [Code] [Modell]
Minicpm [Papier] [Code] [Modell]
MIMTRAL-8X22B [Papier] [Code] [Modell]
PHI-3 [Papier] [Modell]
LAMA 3 [Papier] [Code] [Modell]
Qwen-1.5-110B [Papier] [Code] [Modell]
QWEN2 [Papier] [Code] [Modell]
LAMA 3.1 [Papier] [Code] [Modell]
Qwen2.5 [Papier] [Code] [Modell]
Lama 3.2 [Papier] [Code] [Modell]
P-Tuning [Papier] [Code]
Lora [Papier] [Code]
P-Tuning V2 [Papier] [Code]
RLHF [Papier] [Code]
RRHF [Papier] [Code]
Qlora [Papier] [Code]
RLTF [Papier] [Code]
RRTF [Papier]
RLAIF [Papier]
Wikisql [Papier] [Code] [Datensatz]
Spider 1.0 [Papier] [Code] [Datensatz]
SPARC [Papier] [Code] [Datensatz]
Cspider [Papier] [Code] [Datensatz]
COSQL [Papier] [Code] [Datensatz]
TableQA [Papier] [Datensatz]
Dusql [Papier] [Datensatz]
Kagagledbqa [Papier] [Code] [Datensatz]
Chase [Papier] [Code] [Datensatz]
Bird-SQL [Papier] [Code] [Datensatz]
Bird-SQL Mini-Dev [Papier] [Code] [Datensatz]
Spider 2.0 [Papier] [Code] [Datensatz]
Ausführungsgenauigkeit (Ex) [Papier]
Exakte Übereinstimmung (EM) [Papier]
Mindsql
Premsql
DB-GPT-Hub
SQLCODER
modal_finetune_sql
Lama-effiziente Einstellung
Wenn Sie Text2SQL für Ihre Forschung oder Entwicklung nützlich finden, geben Sie bitte das folgende Papier an:
@misc { zhou2024dbgpthub ,
title = { DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models } ,
author = { Fan Zhou and Siqiao Xue and Danrui Qi and Wenhui Shi and Wang Zhao and Ganglin Wei and Hongyang Zhang and Caigai Jiang and Gangwei Jiang and Zhixuan Chu and Faqiang Chen } ,
year = { 2024 } ,
eprint = { 2406.11434 } ,
archivePrefix = { arXiv } ,
primaryClass = { id='cs.DB' full_name='Databases' is_active=True alt_name=None in_archive='cs' is_general=False description='Covers database management, datamining, and data processing. Roughly includes material in ACM Subject Classes E.2, E.5, H.0, H.2, and J.1.' }
}Eosphoros
Awesome-aigc-Tutorials