اللغة الإنجليزية |中文版| ورق
البرامج التعليمية والموارد المنسقة لنماذج اللغة الكبيرة ، Text2SQL ، Text2DSL ، Text2Api ، Text2Vis والمزيد.
نرحب بحرارة بالمساهمات من الجميع ، سواء كنت قد وجدت خطأً مطبعيًا أو خطأ أو اقتراحًا أو نرغب في مشاركة مورد يتعلق بـ LLM+Text2SQL. للحصول على إرشادات مفصلة حول كيفية المساهمة ، يرجى الاطلاع على ملف المساهمة.
| wikisql | عنكبوت تطابق بالضبط (م) | عنكبوت التنفيذ الدقيق (السابقين) | طائر درجة كفاءة صالحة قائمة على المكافآت (R-VES) | طائر دقة التنفيذ (EX) | |
|---|---|---|---|---|---|
| ؟ 1 | 93.0 (2021/05-SEAD+فك تشفير الموجهة إلى التنفيذ) | 81.5 (2023/11-miniseek) | 91.2 (2023/11-miniseek) | 69.36 (2024/08-OpenSearch-SQL ، V2 + GPT-4O) | 73.00 (2024/09-Chase-SQL + Gemini) |
| ؟ 2 | 92.7 (2021/03-SDSQL+فك التشفير الموجهة للتنفيذ) | 74.0 (2022/09-Graphix-3B + Picard) | 86.6 (2023/08-Dail-SQL + GPT-4 + التوافق الذاتي) | 68.79 (2024/08-EXSL + Granite-34b-Code) | 72.39 (2024/09-asskdata + GPT-4O) |
| ؟ 3 | 92.5 (2020/11-II-SQL+فك التشفير الموجهة للتنفيذ) | 73.9 (2022/09-Catsql + Grappa) | 86.2 (2023/08-Dail-SQL + GPT-4) | 68.44 (2024/09-Chase-SQL + Gemini) | 72.28 (2024/08-OpenSearch-SQL ، V2 + GPT-4O) |
| 4 | 92.2 (2020/03-Hydranet+فك تشفير التنفيذ) | 73.1 (2022/09-SHAP + PICARD) | 85.6 (2023/10-DPG-SQL + GPT-4 + التصحيح الذاتي) | 67.41 (2024/07-Distillery + GPT-4O) | 71.83 (2024/07-Distillery + GPT-4O) |
| 5 | 91.9 (2020/12-Bridge+فك تشفير الموجهة إلى التنفيذ) | 72.9 (2022/05-g³r + lgesql + electra) | 85.3 (2023/04-DIN-SQL + GPT-4) | 66.92 (2024/09-asskdata + GPT-4O) | 70.37 (2024/08-EXSL + Granite-34b-Code) |
| 6 | 91.8 (2019/08-X-SQL+فك التشفير الموجهة للتنفيذ) | 72.4 (2022/08-dsdsql+T5-1.1-LM100K-XL) | 83.9 (2023/07-hindsight سلسلة من الفكر مع GPT-4) | 66.39 (2024/08-insights ai) | 70.26 (2024/08-insights ai) |
| 7 | 91.4 (2021/03-SDSQL) | 72.4 (2022/05-T5-SR) | 82.3 (2023/06-C3 + ChatGPT + Zero-Shot) | 66.25 (2024/05-EXSL + Granite-20B-Code) | 70.21 (2024/07-الأرجواني + الأحمر + GPT-4O) |
| 8 | 91.1 (2020/12-BRIDGE) | 72.2 (2022/12-N-أفضل قائمة Rerankers + Picard) | 80.8 (2023/07-hindsight سلسلة من التفكير مع GPT-4 والتعليمات) | 65.70 (2024/07-RECAP + Gemini) | 69.03 (2024/07-RECAP + Gemini) |
| 9 | 91.0 (2021/04-text2sqlgen + EG) | 72.1 (2021/09-S²SQL + Electra) | 79.9 (2023/02-desdsql-3b + NATSQ) | 65.62 (2024/07-الأرجواني + الأحمر + GPT-4O) | 68.87 (2024/07 بايت) |
| 10 | 90.5 (2020/11-seqgensql+EG) | 72.0 (2023/02-desdsql-3b + natsql) | 78.5 (2022/11-SEAD + PQL) | 63.68 (2024/08-Arcwise + GPT-4O) | 67.86 (2024/05-EXSL + Granite-20B-Code) |
(2024-ARXIV) من اللغة الطبيعية إلى SQL: مراجعة أنظمة النص إلى SQL المستندة إلى LLM [ورقة]
(2024-ARXIV) نموذج لغة كبير محسّن نص إلى SQL: مسح [ورقة]
(2024-ARXIV) دراسة استقصائية لـ NL2SQL مع نماذج لغة كبيرة: أين نحن ، وأين نحن ذاهبون؟ [ورقة] [رمز]
(2024-ARXIV) دراسة استقصائية حول استخدام نماذج لغة كبيرة لمهام النص إلى SQL [ورقة]
(2023-VLDB ، CCF-A) دراسة استقصائية حول مقاربات التعلم العميق للنص إلى SQL [ورقة]
(2022-TKDE ، CCF-A) دراسة استقصائية عن تحليل النص إلى SQL: المفاهيم والأساليب والاتجاهات المستقبلية [ورقة]
(2022-coloing ، CCF-B) التطورات الحديثة في النص إلى SQL: دراسة استقصائية لما لدينا وما نتوقعه [ورقة]
(2022-ARXIV) نص تعليمي عميق مدفوعة اللغات الطبيعية لتحويل استعلام SQL: دراسة استقصائية [ورقة]
(2024-ARXIV ، لا شيء) Chase-SQL : التفكير متعدد المسارات وتفضيل اختيار المرشح المحسّن في النص إلى SQL [ورقة]
(2024-ARXIV ، لا شيء) E-SQL : المخطط المباشر الذي يربطه إثراء الأسئلة في النص إلى SQL [ورقة] [رمز]
(2024-ARXIV ، لا شيء) تقطير : وفاة المخطط الربط؟ نص إلى SQL في عصر نماذج اللغة المعلقة جيدًا [ورقة]
(2024-ARXIV ، لا شيء) DB-GPT-HUB : نحو وضع نصي مؤكدين مفتوحًا إلى SQL بواسطة نماذج لغة كبيرة [ورقة] [رمز]
(2024-ARXIV ، لا شيء) supersql : فجر اللغة الطبيعية إلى SQL: هل نحن مستعدون تمامًا؟ [ورقة] [رمز]
(2024-ARXIV ، لا شيء) الشطرنج : تسخير السياق لتوليف SQL الفعال [ورقة] [رمز]
(2023-ARXIV ، لا شيء) MAC-SQL : إطار تعاوني متعدد الوكلاء لـ TEXT TO-SQL [PAPER] [CODE]
(2023-ARXIV ، لا شيء) DBCᴏᴘɪʟᴏᴛ : توسيع نطاق الاستعلام عن اللغة الطبيعية لقواعد البيانات الضخمة [ورقة] [رمز]
(2023-ARXIV ، لا شيء) TEXT-TO-SQL ممكّن من خلال نماذج اللغة الكبيرة: تقييم قياسي [ورقة] [رمز]
(2023-AAAI 2023 ، CCF-A) RESDSQL : مخطط فك الارتباط وربط الهيكل العظمي من أجل النص إلى SQL [ورقة] [رمز]
(2023-ARXIV ، لا شيء) يمكن أن يكون LLM بالفعل بمثابة واجهة قاعدة بيانات؟ مقعد كبير لقاعدة بيانات واسعة النطاق على ترتيب النص إلى SQLS [ورقة] [رمز]
(2023-ARXIV ، لا شيء) DIN-SQL : تعلم التعلم داخل السياق من النص إلى SQL مع التصحيح الذاتي [ورقة] [رمز]
(2023-ARXIV ، لا شيء) تقييم شامل لقدرة Chatgpt Zero-Shot to-to-SQL [Paper] [CODE]
(2023-ICLR ، CCF-A) نماذج لغة الربط في اللغات الرمزية [ورقة] [رمز]
(2023-SIGMOD ، CCF-A) ترجمة نصية إلى SQL قليلة باستخدام الهيكل والتعلم المطال به للمحتوى [ورقة] [رمز]
(2023-ICASSP ، CCF-B) T5-SR : استراتيجية فك تشفير SEQ-to-SEQ موحدة لتحليل الدلالي [ورقة]
(2022-ACL ، CCF-A) S 2 SQL : حقن بناء الجملة على تشفير رسم بياني للتفاعل بين SqueMA لمحلات النص إلى SQL [ورقة]
(2022-NAACL ، CCF-B) SEAD : جيل من شامل إلى طرف إلى SQL مع تقليل مخطط [ورقة]
(2022-EMNLP ، CCF-B) نجمة : SQL موجهة مسبقًا للتدريب على التحليل النصية المعتمدة على السياق إلى SQL [ورقة] [رمز]
(2022-EMNLP ، CCF-B) RASAT : دمج الهياكل العلائقية في نموذج SEQ2SEQ pretrained لنص text to-sql [paper] [رمز]
(2022-EMNLP ، CCF-B) CQR-SQL : إعادة صياغة أسئلة المحادثة المحسنة المعتمدة على السياق إلى SQL [ورقة]
(2022-ACL ، CCF-A) HIE-SQL : شبكة محسّنة للتاريخ لشبكة التحليل الدلالي المعتمد على السياق إلى SQL [ورقة]
(2022-ARXIV ، لا شيء) أهمية تجميع بيانات عالية الجودة للحلية النصية إلى SQL [ورقة]
(2021-ACL ، CCF-A) نمذجة الحوار مفصول وتوحل الدلالي لنص متعدد المنعطفات إلى SQL [ورقة]
(2021-ARXIV ، لا شيء) إيلاء المزيد من الاهتمام للتاريخ: استراتيجية نمذجة السياق للنص المحادثة إلى SQL [ورقة] [رمز]
(2021-ICLR ، CCF-A) الدرجة : التدريب المسبق لتمثيل السياق في التحليل الدلالي المحادثة [ورقة]
(2021-DASFAA ، CCF-B) نهج NL2SQL التفاعلي مع استراتيجية إعادة الاستخدام [ورقة]
(2021-NAACL ، CCF-B) presring-preser-pretring for text to-sql [paper]
(2021-EMNLP ، CCF-B) Picard : تحليل تدريجي لتفكك التلقائي التلقائي من نماذج اللغة [ورقة] [رمز]
(2021-ICLR ، CCF-A) GRAPPA : التدريب قبل التدريب على الجدول لتحليل الجدول الدلالي [ورقة] [رمز]
(2021-ACL ، CCF-A) LGESQL : رسم رسم بياني محسّن إلى SQL مع علاقات محلية وغير محلية مختلطة [PAPER] [CODE]
(2020-EMNLP ، CCF-B) سد البيانات النصية والجدولة للمنصات عبر المجال إلى التحليل الدلالي [ورقة] [رمز]
(2020-ACL ، CCF-A) Tabert : pretring لفهم المفاصل للبيانات النصية والجدولية [ورقة] [رمز]
(2020-ACL ، CCF-A) RAT-SQL : مخطط مخطط العلاقات ويربطهم لمحللات النص إلى SQL [ورقة] [رمز]
(2020-EMNLP ، CCF-B) أذكر الاستخراج والربط لتوليد استعلام SQL [Paper]
(2020-EMNLP ، CCF-B) IGSQL : نموذج عصبي يعتمد على مخطط قاعدة البيانات للتوليد النصي المعتمد على السياق إلى SQL [PAPER] [CODE]
(2020-ARXIV ، لا شيء) شبكة الترتيب الهجينة لـ Text to-SQL [Paper] [Code]
(2019-ARXIV ، لا شيء) X-SQL : تعزيز تمثيل المخطط مع السياق [ورقة]
(2019-EMNLP ، CCF-B) التفكير العالمي على هياكل قاعدة البيانات لتحليل النص إلى SQL [ورقة] [رمز]
(2019-EMNLP ، CCF-B) توليد استعلام SQL المستند إلى التحرير للأسئلة المعتمدة على السياق عبر المجال [ورقة] [رمز]
(2019-ACL ، CCF-A) يمثل بنية المخطط مع الشبكات العصبية الرسم البياني لتحليل النص إلى SQL [ورقة] [رمز]
(2019-ACL ، CCF-A) نحو النص المعقد إلى SQL في قاعدة بيانات المجال المتقاطع مع تمثيل وسيطة [ورقة] [رمز]
(2018-EMNLP ، CCF-B) SYNTAXSQLNET : شبكات شجرة بناء الجملة لمهمة معقدة وعصبية إلى SQL [ورقة] [رمز]
(2018-NAACL ، CCF-B) TYPERSQL : جيل عصبي مدرك من النوع إلى المعرفة [PAPER] [رمز]
(2017-ARXIV ، لا شيء) SQLNET : إنشاء استفسارات منظمة من اللغة الطبيعية دون التعلم التعزيز [ورقة] [رمز]
لاما [ورقة] [رمز] [نموذج]
ChatGlm [Paper] [Code] [Model]
الألبكة [ورقة] [رمز] [نموذج]
Vicuna [Paper] [Code] [Model]
WizardLM [ورقة] [رمز] [نموذج]
Falcon [Paper] [Code] [Model]
ChatGlm2 [ورقة] [رمز] [نموذج]
Baichuan-7B [رمز] [النموذج]
Baichuan-13B [رمز] [النموذج]
internlm [ورقة] [رمز] [نموذج]
لاما 2 [ورقة] [رمز] [نموذج]
رمز llama [ورقة] [رمز] [النموذج]
Qwen [Paper] [Code] [Model]
Baichuan 2 [Paper] [Code] [Model]
PHI-1.5 [ورقة] [نموذج]
MISTRAL-7B [PAPER] [CODE] [MODEL]
Deepseek [ورقة] [رمز] [نموذج]
minicpm [ورقة] [رمز] [نموذج]
mixtral-8x22b [paper] [code] [model]
PHI-3 [ورقة] [نموذج]
لاما 3 [ورقة] [رمز] [نموذج]
QWEN-1.5-110B [ورقة] [رمز] [النموذج]
QWEN2 [ورقة] [رمز] [نموذج]
لاما 3.1 [ورقة] [رمز] [النموذج]
QWEN2.5 [ورقة] [رمز] [نموذج]
لاما 3.2 [ورقة] [رمز] [نموذج]
P-Tuning [Paper] [Code]
لورا [ورقة] [رمز]
p-tuning v2 [paper] [رمز]
RLHF [ورقة] [رمز]
RRHF [ورقة] [رمز]
qlora [ورقة] [رمز]
RLTF [ورقة] [رمز]
RRTF [ورقة]
RLAIF [ورقة]
wikisql [ورقة] [رمز] [مجموعة البيانات]
العنكبوت 1.0 [ورقة] [رمز] [مجموعة البيانات]
SPARC [PAPER] [CODE] [DATASET]
CSPIDER [PAPER] [CODE] [DATASET]
COSQL [PAPER] [CODE] [DATASET]
TableQa [ورقة] [مجموعة البيانات]
dusql [ورقة] [مجموعة البيانات]
kaggledbqa [ورقة] [رمز] [مجموعة البيانات]
Chase [Paper] [Code] [DataSet]
Bird-SQL [Paper] [Code] [DataSet]
Bird-SQL mini-dev [paper] [Code] [Dataset]
Spider 2.0 [Paper] [Code] [Dataset]
دقة التنفيذ (على سبيل المثال) [ورقة]
مطابقة دقيقة (EM) [ورقة]
Mindsql
premsql
DB-GPT-HUB
sqlcoder
modal_finetune_sql
للااما التثبيت
إذا وجدت Text2SQL مفيدًا للبحث أو التطوير ، فيرجى الاستشهاد بالورقة التالية:
@misc { zhou2024dbgpthub ,
title = { DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models } ,
author = { Fan Zhou and Siqiao Xue and Danrui Qi and Wenhui Shi and Wang Zhao and Ganglin Wei and Hongyang Zhang and Caigai Jiang and Gangwei Jiang and Zhixuan Chu and Faqiang Chen } ,
year = { 2024 } ,
eprint = { 2406.11434 } ,
archivePrefix = { arXiv } ,
primaryClass = { id='cs.DB' full_name='Databases' is_active=True alt_name=None in_archive='cs' is_general=False description='Covers database management, datamining, and data processing. Roughly includes material in ACM Subject Classes E.2, E.5, H.0, H.2, and J.1.' }
}البوسفوروس
رهيبة-AIGC-tutorials