Английский |中文版| Бумага
Кураторские учебники и ресурсы для крупных языковых моделей, Text2sql, Text2dsl, Text2api, Text2vis и многое другое.
Мы тепло приветствуем взносы от всех, независимо от того, нашли ли вы опечатку, ошибку, имеем предложение или хочется поделиться ресурсом, связанным с LLM+Text2sql. Для получения подробных рекомендаций о том, как внести свой вклад, см. В нашем файле ancom.md.
| Wikisql | Паук Точное совпадение (em) | Паук Точное исполнение (Ex) | ПТИЦА Допустимый балл эффективности на основе вознаграждений (R-VES) | ПТИЦА Точность исполнения (Ex) | |
|---|---|---|---|---|---|
| ? 1 | 93.0 (2021/05-Sade+Декодирование под управлением выполнением) | 81.5 (2023/11-Miniseek) | 91.2 (2023/11-Miniseek) | 69,36 (2024/08-Opensearch-SQL, V2 + GPT-4O) | 73,00 (2024/09-chase-sql + Gemini) |
| ? 2 | 92.7 (2021/03-SDSQL+Декодирование управления выполнением) | 74.0 (2022/09-Графикс-3b + Пикард) | 86.6 (2023/08-dail-sql + gpt-4 + самосогласованность) | 68,79 (2024/08-Exsl + Granite-34B-код) | 72,39 (2024/09-Askdata + GPT-4O) |
| ? 3 | 92,5 (2020/11-I-SQL+Декодирование управления выполнением) | 73,9 (2022/09-catsql + grappa) | 86.2 (2023/08-dail-sql + gpt-4) | 68.44 (2024/09-chase-sql + Gemini) | 72,28 (2024/08-Opensearch-SQL, V2 + GPT-4O) |
| 4 | 92.2 (2020/03-гидранет+декодирование управления исполнением) | 73.1 (2022/09-корабль + Пикард) | 85,6 (2023/10-DPG-SQL + GPT-4 + самокоррекция) | 67.41 (2024/07-дистиллеры + GPT-4O) | 71.83 (2024/07-дистиллеры + GPT-4O) |
| 5 | 91.9 (2020/12-мост+декодирование управления выполнением) | 72,9 (2022/05-G³R + LGESQL + Electra) | 85,3 (2023/04-дин-SQL + GPT-4) | 66.92 (2024/09-Askdata + GPT-4O) | 70.37 (2024/08-Exsl + Granite-34B-код) |
| 6 | 91.8 (2019/08-X-SQL+декодирование под управлением выполнением) | 72.4 (2022/08-RESDSQL+T5-1.1-LM100K-XL) | 83,9 (2023/07-indsight heange of Geand of GPT-4) | 66.39 (2024/08-insights AI) | 70.26 (2024/08-insights AI) |
| 7 | 91.4 (2021/03-SDSQL) | 72.4 (2022/05-T5-SR) | 82.3 (2023/06-C3 + CHATGPT + Zero-Shot) | 66.25 (2024/05-EXSL + Granite-20B-код) | 70.21 (2024/07-Purple + Red + GPT-4O) |
| 8 | 91.1 (2020/12-мост) | 72,2 (2022/12-Н лучшего списка «Реранкеры + Пикард») | 80.8 (2023/07-х пошаговая цепь мышления с GPT-4 и инструкциями) | 65,70 (2024/07-Recap + Gemini) | 69.03 (2024/07-Recap + Gemini) |
| 9 | 91.0 (2021/04-Text2sqlgen + например) | 72.1 (2021/09-S² SQL + Electra) | 79,9 (2023/02-RESDSQL-3B + NATSQ) | 65,62 (2024/07-Purple + Red + GPT-4O) | 68,87 (2024/07-байтобразование) |
| 10 | 90.5 (2020/11-seqgensql+например) | 72,0 (2023/02-РЕССКЛ-3B + NATSQL) | 78.5 (2022/11-Sade + PQL) | 63,68 (2024/08-ярковая + GPT-4O) | 67.86 (2024/05-EXSL + Granite-20B-код) |
(2024-Arxiv) от естественного языка до SQL: обзор систем Text-Sql на основе LLM [Paper]
(2024-Arxiv)
(2024-Arxiv) Обзор NL2SQL с большими языковыми моделями: куда мы и куда мы идем? [Paper] [Код]
(2024-Arxiv) Обследование по использованию больших языковых моделей для задач текста к SQL [Paper]
(2023-Vldb, CCF-A) Обзор подходов к глубокому обучению для текста к SQL [Paper]
(2022-TKDE, CCF-A) Обзор анализа текста до SQL: концепции, методы и будущие направления [Paper]
(2022-Coloing, CCF-B) Последние достижения в области текста в SQL: обзор того, что у нас есть и чего мы ожидаем [Paper]
(2022-Arxiv) Текст естественных языков с глубоким обучением на природные языки в SQL Conversion: опрос [Paper]
(2024-Arxiv, нет) Chase-SQL : мультиплановая рассуждения и предпочтения оптимизированный выбор кандидатов в Text-Sql [Paper]
(2024-Arxiv, нет) e-sql : прямая схема, связывающаяся через обогащение вопросов в текстовом до SQL [Paper] [Код]
(2024-Arxiv, нет) Ликероводочный завод : смерть схемы, связывающую? Текст-к-квл в эпоху хорошо разобразных языковых моделей [Paper]
(2024-Arxiv, нет) DB-GPT-Hub : к открытому сравнению текста до SQL, уполномоченными крупными языковыми моделями [Paper] [CODE]
(2024-arxiv, нет) SuperSQL : Рассвет естественного языка для SQL: мы полностью готовы? [Paper] [Код]
(2024-Arxiv, нет) Шахматы : контекстуальное использование для эффективного синтеза SQL [Paper] [CODE]
(2023-Arxiv, нет) Mac-SQL : многоагентная совместная структура для текста в Squ [Paper] [Code]
(2023-Arxiv, нет) DBCᴏᴘɪʟᴏᴛ : масштабирование запросов естественного языка для массивных баз данных [Paper] [Код]
(2023-Arxiv, нет).
(2023-AAAI 2023, CCF-A) RESDSQL : Схема развязки связывание и анализ скелета для текста к SQL [Paper] [Код]
(2023-Arxiv, нет) может ли LLM уже служить интерфейсом базы данных? Большая скамейка для крупномасштабной базы данных заземленного текста в Sqls [Paper] [Code]
(2023-Arxiv, нет) DIN-SQL : разлагаемое в контекстное изучение текста к SQL с самокоррекцией [Paper] [CODE]
(2023-Arxiv, нет) Комплексная оценка возможности с нулевым выстрелом CHATGPT [Paper] [Код] [Код] [Код]
(2023-ICLR, CCF-A) Связывая языковые модели на символических языках [Paper] [CODE]
(2023-SIGMOD, CCF-A) Перевод текста в S-SQL с использованием Структурного и контента
(2023-ICASSP, CCF-B) T5-SR : единая стратегия декодирования SEQ-SEQ для семантического анализа [бумага]
(2022-aCl, CCF-A) S 2 SQL : инъекционный синтаксис к графику графа взаимодействия с схемой для анализа текста к SQL [Paper]
(2022-NAACL, CCF-B) Sead : сквозное поколение текста к SQL с обезвоживанием с учетом схемы [Paper]
(2022-EMNLP, CCF-B) Звезда : SQL-управляемое предварительное обучение для контекстного зависимого от анализа текста к SQL [Paper] [CODE]
(2022-EMNLP, CCF-B) RASAT : Интеграция реляционных структур в предварительную модель SEQ2SEQ для текста до SQL [Paper] [CODE]
(2022-EMNLP, CCF-B) CQR-SQL : переформулирование вопросов разговорного вопроса Увеличенная контекстная зависимая от контекста
(2022-ACL, CCF-A) Hie-SQL : Информация об истории, улучшенная сеть для контекста-зависимого от семантического анализа текста к SQL [Paper]
(2022-Arxiv, нет) Важность синтеза высококачественных данных для анализа текста к SQL [Paper]
(2021-ACL, CCF-A) Разрешенное моделирование диалога и семантический анализ для многообразования текста в SQL [Paper]
(2021-Arxiv, нет) Обратите больше внимания на историю: стратегия моделирования контекста для разговорного текста в S-SQL [Paper] [CODE]
(2021-ICLR, CCF-A) Оценка : предварительное обучение для представления контекста в разговорном семантическом анализе [Paper]
(2021-DASFAA, CCF-B) Интерактивный подход NL2SQL с стратегией повторного использования [Paper]
(2021-NAACL, CCF-B) Структурная предварительная подготовка для текста в SQL [Paper]
(2021-EMNLP, CCF-B) PICARD : Диаграмм постепенно для ограниченного авторегрессивного декодирования из языковых моделей [Paper] [CODE]
(2021-ICLR, CCF-A) GRAPPA : Грамматика-аугментированная предварительная тренировка для табличного семантического анализа [бумага] [код]
(2021-ACL, CCF-A) LGESQL : Линейный график Улучшенный текст-кв.
(2020-EMNLP, CCF-B) Создание текстовых и табличных данных для перекрестного доменного семантического анализа текста к SQL [Paper] [Код]
(2020-ACL, CCF-A) Tabert : Предварительная подготовка для совместного понимания текстовых и табличных данных [Paper] [Code]
(2020-ACL, CCF-A) RAT-SQL : схема с учетом отношений, кодирование и связывание для анализаторов текста к SQL [Paper] [CODE]
(2020-Энмлп, CCF-B) Упомяните извлечение и связывание для генерации запросов SQL [Paper]
(2020-EMNLP, CCF-B) IGSQL : На основе нейронной модели взаимодействия схемой схемы базы данных для контекста-зависимого генерации текста к SQL [Paper] [CODE]
(2020-Arxiv, нет) Гибридная сеть ранжирования для текста до SQL [Paper] [Code]
(2019-Arxiv, нет) x-sql : подкрепление схемы представления с контекстом [Paper]
(2019-EMNLP, CCF-B) Глобальные рассуждения о структурах базы данных для анализа текста к SQL [Paper] [CODE]
(2019-EMNLP, CCF-B) На основе редактирования SQL-запросов для междоменных контекста-зависимых вопросов [Paper] [CODE]
(2019-ACL, CCF-A) Представление структуры схемы с нейронными сетями графиков для анализа текста к SQL [Paper] [CODE]
(2019-ACL, CCF-A) к комплексному тексту к SQL в базе данных междоменного с промежуточным представлением [Paper] [CODE]
(2018-EMNLP, CCF-B) SyntaxSQLnet : Синтаксические деревья сети для сложного и междоменного текста-к SQL Задача [Paper] [Code]
(2018-NAACL, CCF-B) TIPESQL : Основанный на знаниях генерация нейронного текста Tyx-to-SQL [Paper] [CODE]
(2017-Arxiv, нет) SQLnet : генерирование структурированных запросов из естественного языка без обучения подкрепления [Paper] [CODE]
Llama [Paper] [Code] [Модель]
Chatglm [Paper] [Code] [Модель]
Alpaca [Paper] [Code] [Модель]
Vicuna [Paper] [Code] [Модель]
Wizardlm [Paper] [Code] [Модель]
Сокол [Paper] [Code] [Модель]
Chatglm2 [Paper] [Code] [Модель]
Baichuan-7b [code] [Модель]
Baichuan-13b [Code] [Модель]
Internlm [Paper] [CODE] [Модель]
Llama 2 [Paper] [Код] [Модель]
Код Llama [Paper] [Code] [Модель]
QWEN [Paper] [CODE] [Модель]
Baichuan 2 [Paper] [Code] [Модель]
Phi-1.5 [Paper] [Модель]
MISTRAL-7B [Paper] [CODE] [Модель]
DeepSeek [Paper] [Code] [Модель]
Minicpm [Paper] [Code] [Модель]
Mixtral-8x22b [Paper] [Code] [Модель]
PHI-3 [Paper] [Модель]
Llama 3 [Paper] [Код] [Модель]
QWEN-1.5-110B [Paper] [CODE] [Модель]
QWEN2 [Paper] [CODE] [Модель]
Llama 3.1 [Paper] [Код] [Модель]
QWEN2.5 [Paper] [CODE] [Модель]
Llama 3.2 [Paper] [Код] [Модель]
P-Tuning [Paper] [Код]
Lora [Paper] [Код]
P-Tuning v2 [Paper] [Код]
Rlhf [Paper] [Код]
RRHF [Paper] [Код]
Qlora [Paper] [Код]
RLTF [Paper] [Код]
Rrtf [бумага]
Rlaif [бумага]
Wikisql [Paper] [Code] [DataSet]
Spider 1.0 [Paper] [Code] [Набор данных]
Sparc [paper] [code] [набор данных]
Cspider [Paper] [Code] [DataSet]
Cosql [paper] [code] [набор данных]
TableQA [Paper] [Набор данных]
Dusql [Paper] [Набор данных]
Kaggledbqa [Paper] [Code] [DataSet]
Chase [Paper] [Code] [Набор данных]
Bird-Sql [Paper] [Code] [DataSet]
Bird-SQL Mini-Dev [Paper] [Code] [Набор данных]
Spider 2.0 [Paper] [Code] [Набор данных]
Точность исполнения (Ex) [Paper]
Точное совпадение (EM) [бумага]
Mindsql
PREMSQL
DB-GPT-Hub
SQLCODER
MODAL_FINETUNE_SQL
Лама-эффективная настройка
Если вы найдете Text2SQL полезным для исследования или разработки, пожалуйста, укажите следующую статью:
@misc { zhou2024dbgpthub ,
title = { DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models } ,
author = { Fan Zhou and Siqiao Xue and Danrui Qi and Wenhui Shi and Wang Zhao and Ganglin Wei and Hongyang Zhang and Caigai Jiang and Gangwei Jiang and Zhixuan Chu and Faqiang Chen } ,
year = { 2024 } ,
eprint = { 2406.11434 } ,
archivePrefix = { arXiv } ,
primaryClass = { id='cs.DB' full_name='Databases' is_active=True alt_name=None in_archive='cs' is_general=False description='Covers database management, datamining, and data processing. Roughly includes material in ACM Subject Classes E.2, E.5, H.0, H.2, and J.1.' }
}Эосфорос
Потрясающие точки зрения