Bahasa Inggris |中文版| Kertas
Tutorial dan sumber daya yang dikuratori untuk model bahasa besar, text2sql, text2dsl, text2api, text2vis dan banyak lagi.
Kami sangat menyambut kontribusi dari semua orang, apakah Anda telah menemukan kesalahan ketik, bug, memiliki saran, atau ingin berbagi sumber daya yang terkait dengan LLM+Text2SQL. Untuk pedoman terperinci tentang cara berkontribusi, silakan lihat file contributing.md kami.
| Wikisql | Laba -laba Pertandingan persis (Em) | Laba -laba Eksekusi yang tepat (EX) | BURUNG Skor efisiensi valid berbasis hadiah (R-OVes) | BURUNG Akurasi Eksekusi (EX) | |
|---|---|---|---|---|---|
| ? 1 | 93.0 (2021/05-lead+decoding yang dipandu eksekusi) | 81.5 (2023/11-Miniseek) | 91.2 (2023/11-Miniseek) | 69.36 (2024/08-opensearch-sql, v2 + gpt-4o) | 73.00 (2024/09-chase-sql + gemini) |
| ? 2 | 92.7 (2021/03-SDSQL+decoding yang dipandu eksekusi) | 74.0 (2022/09-graphix-3b + picard) | 86.6 (2023/08-Dail-sql + gpt-4 + konsistensi diri) | 68.79 (2024/08-exsl + granite-34b-code) | 72.39 (2024/09-askdata + gpt-4o) |
| ? 3 | 92.5 (2020/11 -e-sql+decoding yang dipandu eksekusi) | 73.9 (2022/09-Catsql + Grappa) | 86.2 (2023/08-Dail-sql + GPT-4) | 68.44 (2024/09-chase-sql + gemini) | 72.28 (2024/08-opensearch-sql, v2 + gpt-4o) |
| 4 | 92.2 (2020/03-hydranet+decoding yang dipandu eksekusi) | 73.1 (2022/09-kapal + picard) | 85.6 (2023/10-dpg-sql + gpt-4 + koreksi diri) | 67.41 (2024/07-Distillery + GPT-4O) | 71.83 (2024/07-Distillery + GPT-4O) |
| 5 | 91.9 (2020/12-bridge+decoding yang dipandu eksekusi) | 72.9 (2022/05-g³r + lgesql + electra) | 85.3 (2023/04-din-SQL + GPT-4) | 66.92 (2024/09-askdata + gpt-4o) | 70.37 (2024/08-exsl + granite-34b-code) |
| 6 | 91.8 (2019/08-x-sql+decoding yang dipandu eksekusi) | 72.4 (2022/08-RESDSQL+T5-1.1-LM100K-XL) | 83.9 (2023/07-Hindsight rantai pemikiran dengan GPT-4) | 66.39 (2024/08-Insights AI) | 70.26 (2024/08-Insights AI) |
| 7 | 91.4 (2021/03-SDSQL) | 72.4 (2022/05-T5-SR) | 82.3 (2023/06-C3 + chatgpt + nol-shot) | 66.25 (2024/05-exsl + granite-20b-code) | 70.21 (2024/07-purple + merah + gpt-4o) |
| 8 | 91.1 (2020/12-jembatan) | 72.2 (2022/12-N-Best List Rerankers + Picard) | 80.8 (2023/07-Hindsight rantai pemikiran dengan GPT-4 dan instruksi) | 65.70 (2024/07-Recap + Gemini) | 69.03 (2024/07-Recap + Gemini) |
| 9 | 91.0 (2021/04-text2sqlgen + misalnya) | 72.1 (2021/09-s²sql + electra) | 79.9 (2023/02-RESDSQL-3B + NATSQ) | 65.62 (2024/07-purple + merah + gpt-4o) | 68.87 (2024/07-Bytebrain) |
| 10 | 90.5 (2020/11-seqgensql+misalnya) | 72.0 (2023/02-RESDSQL-3B + NATSQL) | 78.5 (2022/11-lead + pql) | 63.68 (2024/08-Arcwise + GPT-4O) | 67.86 (2024/05-exsl + granite-20b-code) |
(2024-arxiv) dari bahasa alami ke SQL: Tinjauan sistem teks-ke-SQL berbasis LLM [kertas]
(2024-arxiv) Model Bahasa Besar Ditingkatkan Generasi Teks-ke-SQL: Survei [Kertas]
(2024-Arxiv) Survei NL2SQL dengan model bahasa besar: kemana kita, dan kemana kita akan pergi? [kertas] [kode]
(2024-Arxiv) Survei tentang menggunakan model bahasa besar untuk tugas teks-ke-sql [kertas]
(2023-VLDB, CCF-A) Survei tentang pendekatan pembelajaran mendalam untuk teks-ke-sql [kertas]
(2022-tkde, CCF-A) Survei tentang penguraian teks-ke-sql: konsep, metode, dan arah masa depan [kertas]
(2022-Coloing, CCF-B) Kemajuan terbaru dalam teks-ke-SQL: Survei tentang apa yang kita miliki dan apa yang kita harapkan [kertas]
(2022-arxiv) Pembelajaran mendalam Bahasa Alami Teks ke Konversi Kueri SQL: Survei [Kertas]
(2024-Arxiv, tidak ada) Chase-SQL : Penalaran multi-jalur dan preferensi pemilihan kandidat yang dioptimalkan dalam teks-ke-sql [kertas]
(2024-arxiv, tidak ada) E-SQL : SKEMA Langsung Linking melalui pengayaan pertanyaan dalam teks-ke-sql [kertas] [kode]
(2024-Arxiv, tidak ada) Penyulingan : Kematian Skema yang Menghubungkan? Teks-ke-SQL di Zaman Model Bahasa yang Diaktifkan dengan Baik [Kertas]
(2024-arxiv, tidak ada) DB-GPT-HUB : Menuju Benchmarking Open Text-to-SQL yang diberdayakan oleh model bahasa besar [kertas] [kode]
(2024-Arxiv, tidak ada) SuperSQL : Dawn Bahasa Alami untuk SQL: Apakah kita sepenuhnya siap? [kertas] [kode]
(2024-arxiv, tidak ada) catur : memanfaatkan kontekstual untuk sintesis SQL yang efisien [kertas] [kode]
(2023-arxiv, tidak ada) Mac-SQL : Kerangka kerja kolaboratif multi-agen untuk teks-ke-sql [kertas] [kode]
(2023-arxiv, tidak ada) dbcᴏᴘɪʟᴏᴛ : menskalakan bahasa alami permintaan ke database besar [kertas] [kode]
(2023-arxiv, tidak ada) teks-ke-sql yang diberdayakan oleh model bahasa besar: evaluasi benchmark [kertas] [kode]
(2023-AAAI 2023, CCF-A) RESDSQL : Decoupling Schema Linking dan Skeleton Parsing untuk Text-to-SQL [kertas] [Kode]
(2023-arxiv, tidak ada) yang dapat berfungsi sebagai antarmuka basis data? Bangku besar untuk database skala besar, teks-ke-sqls [kertas] [kode]
(2023-arxiv, tidak ada) DIN-SQL : Pembelajaran dalam konteks yang didekomposisi teks-ke-SQL dengan koreksi diri [kertas] [kode]
(2023-arxiv, tidak ada) Evaluasi komprehensif dari kemampuan Text-to-SQL Zero-shot ChatGPT [kertas] [Kode]
(2023-ICLR, CCF-A) Model Bahasa yang Mengikat dalam Bahasa Simbolik [Kertas] [Kode]
;
(2023-ICASSP, CCF-B) T5-SR : Strategi decoding SEQ-to-seq terpadu untuk parsing semantik [kertas]
(2022-ACL, CCF-A) S 2 SQL : Menyuntikkan sintaks ke encoder grafik interaksi schema pertanyaan untuk parser teks-ke-sql [kertas]
(2022-NAACL, CCF-B) SEAD : Generasi Teks-ke-Ujung-ke-SQL dengan Denoising [kertas] yang sadar skema [kertas]
(2022-emberlp, CCF-B) Bintang : SQL Dipandu Pra-Pelatihan untuk Teks-ke-SQL yang bergantung pada konteks [kertas] [Kode]
(2022-emberlp, CCF-B) RASAT : Mengintegrasikan struktur relasional ke dalam model Seq2seq pretrained untuk teks-ke-sql [kertas] [kode]
(2022-emberlp, CCF-B) CQR-SQL : Reformulasi pertanyaan percakapan ditingkatkan Parser teks-ke-sql yang bergantung pada konteks [kertas]
(2022-ACL, CCF-A) HIE-SQL : Jaringan Informasi Sejarah yang Ditingkatkan untuk Parsing Semantic Text-to-SQL yang bergantung pada konteks [Kertas]
(2022-arxiv, tidak ada) pentingnya mensintesis data berkualitas tinggi untuk penguraian teks-ke-sql [kertas]
(2021-ACL, CCF-A) Pemodelan dialog yang dipisahkan dan parsing semantik untuk multi-giliran teks-ke-sql [kertas]
(2021-Arxiv, tidak ada) lebih memperhatikan sejarah: strategi pemodelan konteks untuk teks-ke-sql percakapan [kertas] [kode]
(2021-ICLR, CCF-A) Skor : Pra-pelatihan untuk representasi konteks dalam parsing semantik percakapan [kertas]
(2021-DASFAA, CCF-B) Pendekatan NL2SQL interaktif dengan strategi penggunaan kembali [kertas]
(2021-NAACL, CCF-B) Pretraining yang didasarkan pada Text-to-SQL [kertas]
(2021-emberlp, CCF-B) PICARD : Parsing secara bertahap untuk decoding regregresif otomatis terbatas dari model bahasa [kertas] [kode]
(2021-ICLR, CCF-A) Grappa : Pra-pelatihan pra-pelatihan tata bahasa untuk penguraian semantik tabel [kertas] [kode]
(2021-ACL, CCF-A) LGESQL : Line Graph Enhanced Text-to-SQL Model dengan Hubungan Lokal dan Non-Local [kertas] [KODE] yang campuran [Kode]
(2020-empu, CCF-B) Mengembalikan data tekstual dan tabel untuk Text-to-SQL Parsing semantik [kertas] [Kode]
(2020-ACL, CCF-A) Tabert : Pretraining untuk pemahaman bersama data tekstual dan tabular [kertas] [kode]
(2020-ACL, CCF-A) Tikus-SQL : Pengkodean Skema Relationshare dan menghubungkan untuk parser teks-ke-sql [kertas] [kode]
(2020-empu, CCF-B) Sebutkan ekstraksi dan tautan untuk SQL Query Generation [kertas]
(2020-empu, CCF-B) IGSQL : Model saraf berbasis grafik interaksi skema database untuk teks-ke-SQL yang bergantung pada konteks [kertas] [kode]
(2020-arxiv, tidak ada) jaringan peringkat hibrida untuk teks-ke-sql [kertas] [kode]
(2019-Arxiv, None) X-SQL : memperkuat representasi skema dengan konteks [kertas]
(2019-IMM, CCF-B) Penalaran global atas struktur database untuk penguraian teks-ke-sql [kertas] [kode]
(2019-IMM, CCF-B) Generasi kueri SQL yang berbasis pengeditan untuk pertanyaan yang bergantung pada konteks silang [kertas] [Kode]
(2019-ACL, CCF-A) yang mewakili struktur skema dengan grafik jaringan saraf untuk penguraian teks-ke-sql [kertas] [kode]
(2019-ACL, CCF-A) Menuju teks-ke-SQL yang kompleks dalam database lintas domain dengan representasi menengah [kertas] [kode]
(2018-IMM, CCF-B) Syntaxsqlnet : Sintaks Tree Networks untuk Tugas Kompleks dan Domainteks-Untuk-SQL [Kertas] [Kode]
(2018-NAACL, CCF-B) TypeQL : Tipe-Aware Neural Text-to-SQL Generation [kertas] [Kode]
(2017-Arxiv, tidak ada) SQLNET : Menghasilkan kueri terstruktur dari bahasa alami tanpa pembelajaran penguatan [kertas] [kode]
Llama [kertas] [kode] [model]
Chatglm [kertas] [kode] [model]
Alpaca [kertas] [kode] [model]
Vicuna [kertas] [kode] [model]
Wizardlm [kertas] [kode] [model]
Falcon [kertas] [kode] [model]
Chatglm2 [kertas] [kode] [model]
Baichuan-7b [kode] [Model]
Baichuan-13b [kode] [Model]
Internlm [kertas] [kode] [model]
Llama 2 [kertas] [kode] [model]
Kode llama [kertas] [kode] [model]
Qwen [kertas] [kode] [model]
Baichuan 2 [kertas] [kode] [Model]
Phi-1.5 [kertas] [model]
Mistral-7b [kertas] [kode] [Model]
Deepseek [kertas] [kode] [model]
Minicpm [kertas] [kode] [model]
Mixtral-8x22b [kertas] [kode] [model]
Phi-3 [kertas] [model]
Llama 3 [kertas] [kode] [model]
Qwen-1.5-110b [kertas] [kode] [model]
Qwen2 [kertas] [kode] [model]
Llama 3.1 [kertas] [kode] [model]
Qwen2.5 [kertas] [kode] [model]
Llama 3.2 [kertas] [kode] [model]
P-tuning [kertas] [kode]
Lora [kertas] [kode]
P-tuning v2 [kertas] [kode]
Rlhf [kertas] [kode]
Rrhf [kertas] [kode]
Qlora [kertas] [kode]
Rltf [kertas] [kode]
RRTF [kertas]
Rlaif [kertas]
Wikisql [kertas] [kode] [dataset]
Spider 1.0 [kertas] [kode] [dataset]
SPARC [kertas] [kode] [dataset]
Cspider [kertas] [kode] [dataset]
Cosql [kertas] [kode] [dataset]
Tableqa [kertas] [dataset]
Dusql [kertas] [dataset]
Kaggledbqa [kertas] [kode] [dataset]
Chase [kertas] [kode] [dataset]
Bird-sql [kertas] [kode] [dataset]
Bird-SQL mini-dev [kertas] [kode] [dataset]
Spider 2.0 [kertas] [kode] [dataset]
Akurasi eksekusi (EX) [kertas]
Pencocokan tepat (EM) [kertas]
mindsql
Premsql
DB-GPT-HUB
SQLCODER
modal_finetune_sql
Llama-efisien-tuning
Jika Anda menemukan Text2SQL berguna untuk penelitian atau pengembangan Anda, silakan kutip makalah berikut:
@misc { zhou2024dbgpthub ,
title = { DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models } ,
author = { Fan Zhou and Siqiao Xue and Danrui Qi and Wenhui Shi and Wang Zhao and Ganglin Wei and Hongyang Zhang and Caigai Jiang and Gangwei Jiang and Zhixuan Chu and Faqiang Chen } ,
year = { 2024 } ,
eprint = { 2406.11434 } ,
archivePrefix = { arXiv } ,
primaryClass = { id='cs.DB' full_name='Databases' is_active=True alt_name=None in_archive='cs' is_general=False description='Covers database management, datamining, and data processing. Roughly includes material in ACM Subject Classes E.2, E.5, H.0, H.2, and J.1.' }
}Eosphoros
Tutorial-AIGC yang mengagumkan