Inglês |中文版| Papel
Tutoriais e recursos com curadoria para grandes modelos de idiomas, text2SQL, text2dsl, text2api, text2Vis e muito mais.
Congratulamo -nos com contribuições calorosas de todos, se você encontrou um erro de digitação, um bug, tem uma sugestão ou queremos compartilhar um recurso relacionado ao LLM+Text2SQL. Para obter diretrizes detalhadas sobre como contribuir, consulte nosso arquivo contribuindo.md.
| Wikisql | Aranha Correspondência exata (em) | Aranha Execução exata (Ex) | PÁSSARO Pontuação de eficiência válida baseada em recompensa (R-VEs) | PÁSSARO Precisão de execução (ex) | |
|---|---|---|---|---|---|
| ? 1 | 93.0 (2021/05-SEAD+decodificação guiada por execução) | 81.5 (2023/11-MINISEK) | 91.2 (2023/11-MINISEK) | 69.36 (2024/08-Opensearch-SQL, V2 + GPT-4O) | 73.00 (2024/09-chase-sql + gemini) |
| ? 2 | 92.7 (2021/03-SDSQL+decodificação guiada por execução) | 74.0 (2022/09-Graphix-3b + Picard) | 86.6 (2023/08-Dail-SQL + GPT-4 + autoconsistência) | 68,79 (2024/08-EXSL + Granite-34B-Code) | 72.39 (2024/09-ASCDATA + GPT-4O) |
| ? 3 | 92.5 (2020/11-IE-SQL+decodificação guiada por execução) | 73.9 (2022/09-CATSQL + GRAPPA) | 86.2 (2023/08-Dail-SQL + GPT-4) | 68.44 (2024/09-chase-sql + gemini) | 72.28 (2024/08-Opensearch-SQL, V2 + GPT-4O) |
| 4 | 92.2 (2020/03-hydranet+decodificação guiada por execução) | 73.1 (2022/09-navio + Picard) | 85.6 (2023/10-DPG-SQL + GPT-4 + Autocorreção) | 67.41 (2024/07-Distillery + GPT-4O) | 71.83 (2024/07-Distillery + GPT-4O) |
| 5 | 91.9 (2020/12-Bridge+decodificação guiada por execução) | 72.9 (2022/05-G³R + lgesql + electra) | 85.3 (2023/04-Din-SQL + GPT-4) | 66.92 (2024/09-ASCDATA + GPT-4O) | 70.37 (2024/08-EXSL + Granite-34B-Code) |
| 6 | 91.8 (2019/08-x-SQL+decodificação guiada por execução) | 72.4 (2022/08-RESDSQL+T5-1.1-LM100K-XL) | 83.9 (2023/07-Hindsight Chain de pensamento com GPT-4) | 66.39 (2024/08-Insights AI) | 70.26 (2024/08-Insights AI) |
| 7 | 91.4 (2021/03-SDSQL) | 72.4 (2022/05-T5-SR) | 82.3 (2023/06-C3 + chatgpt + zero-shot) | 66.25 (2024/05-EXSL + Código de granito-20b) | 70.21 (2024/07-PURPLE + RED + GPT-4O) |
| 8 | 91.1 (2020/12-Bridge) | 72.2 (2022/12-N-Best List Rerrankers + Picard) | 80.8 (2023/07-Hindsight Chain de pensamento com GPT-4 e instruções) | 65.70 (2024/07-RECAP + GEMINI) | 69.03 (2024/07-RECAP + GEMINI) |
| 9 | 91.0 (2021/04-text2sqlgen + por exemplo) | 72.1 (2021/09-S²SQL + Electra) | 79.9 (2023/02-RESDSQL-3B + NATSQ) | 65.62 (2024/07-PURPLE + RED + GPT-4O) | 68.87 (2024/07-bytebrain) |
| 10 | 90.5 (2020/11-seqgensql+por exemplo) | 72.0 (2023/02-RESDSQL-3B + NATSQL) | 78.5 (2022/11-SEAD + PQL) | 63.68 (2024/08-ACTHWWWEE | 67.86 (2024/05-EXSL + Código de granito-20b) |
(2024-ARXIV) da linguagem natural para o SQL: Revisão de sistemas de texto para SQL baseados em LLM [papel]
(2024-ARXIV) Modelo de grande linguagem geração de texto para SQL: uma pesquisa [papel]
(2024-ARXIV) Uma pesquisa do NL2SQL com grandes modelos de idiomas: onde estamos e para onde estamos indo? [papel] [Código]
(2024-ARXIV) Uma pesquisa sobre empregar grandes modelos de idiomas para tarefas de texto para SQL [papel]
(2023-VLDB, CCF-A) Uma pesquisa sobre abordagens de aprendizado profundo para texto para SQL [papel]
(2022-TKDE, CCF-A) Uma pesquisa sobre análise de texto para SQL: conceitos, métodos e direções futuras [papel]
(2022-Colloing, CCF-B) Avanços recentes no texto para SQL: uma pesquisa do que temos e o que esperamos [papel]
(2022-ARXIV) Línguas naturais de aprendizado profundo Texto para a conversão de consultas SQL: uma pesquisa [papel]
(2024-ARXIV, NENHUM) CHASE-SQL : Raciocínio de vários caminhos e seleção de candidatos otimizados de preferência em texto para SQL [papel]
(2024-ARXIV, NENHUM) E-SQL : Esquema direto vinculando por meio de enriquecimento de perguntas no texto para SQL [Paper] [Código]
(2024-ARXIV, Nenhum) Destilaria : A morte do esquema vinculando? Text-to-sql na era dos modelos de idiomas bem fundamentados [papel]
(2024-ARXIV, NENHUM) DB-GPT-HUB : Rumo ao Benchmarking Open Text-to-SQL capacitado por grandes modelos de linguagem [Paper] [Código]
(2024-ARXIV, NENHUM) SUPERSQL : O amanhecer da linguagem natural para SQL: estamos totalmente prontos? [papel] [Código]
(2024-ARXIV, NENHUM) xadrez : aproveitamento contextual para a síntese SQL eficiente [Paper] [Código]
(2023-ARXIV, NENHUM) MAC-SQL : Uma estrutura colaborativa multi-agente para texto para SQL [Paper] [Código]
(2023-ARXIV, NENHUM) DBCᴏᴘɪʟᴏᴛ : Escalando a consulta de linguagem natural para bancos de dados maciços [Paper] [Código]
(2023-ARXIV, NENHUM) TEXT-PARA SQL POLEPERIDO POR MODELOS DE LÍNGUA GRANDE: Uma avaliação de referência [Paper] [Código]
(2023-AAAI 2023, CCF-A) Resdsql : Esquema de desacoplamento Linking and Skeleton Parsing para texto para SQL [Paper] [Código]
(2023-ARXIV, Nenhum) O LLM já pode servir como uma interface de banco de dados? Um grande banco para o banco de dados em larga escala fundamentado em texto para sqls [papel] [código]
(2023-ARXIV, NENHUM) DIN-SQL : Decomposição no Contexto Aprendizagem de Texto para SQL com Autocorreção [Paper] [Código]
(2023-ARXIV, NENHUM) Uma avaliação abrangente da capacidade de texto para SQL do ChatGPT [Código] [Código]
(2023-ICLR, CCF-A) Modelos de linguagem de ligação em linguagens simbólicas [Paper] [Código]
(2023-SIGMOD, CCF-A) Tradução de texto para SQL com poucos tiro usando a estrutura e o conteúdo do aprendizado [Paper] [Código]
(2023-ICASSP, CCF-B) T5-SR : Uma estratégia de decodificação seq-seq unificada para análise semântica [papel]
(2022-ACL, CCF-A) S 2 SQL : Injetando a sintaxe no codificador de gráficos de interação de question-schema para analisadores de texto para SQL [papel]
(2022-Naacl, CCF-B) SEAD : geração de texto para SQL de ponta a ponta com denoising com reconhecimento de esquema [papel]
(2022-ONMLP, CCF-B) : SQL Guiado pré-treinamento para o contexto de texto para SQL Parsing [Paper] [Código]
(2022-ONMLP, CCF-B) Rasat : Integrando estruturas relacionais ao modelo Seq2SEQ pré-treinado para texto para SQL [Paper] [Código]
(2022-ONMLP, CCF-B) CQR-SQL : Reformulação de Questões Conversatacionais Aumente os Parsers de texto para SQL aprimorados de contexto [Paper]
(2022-ACL, CCF-A) HIE-SQL : Rede aprimorada por informações do histórico para análise semântica de texto para SQL dependente de contexto [papel]
(2022-arxiv, nenhum) Importância de sintetizar dados de alta qualidade para análise de texto para SQL [Paper]
(2021-ACL, CCF-A) Modelagem de diálogo desacoplou e análise semântica para texto para Multi-turn-to-SQL [papel]
(2021-ARXIV, NENHUM) Preste mais atenção à história: uma estratégia de modelagem de contexto para o texto para conversação para SQL [Paper] [Código]
(2021-ICLR, CCF-A) Pontuação : pré-treinamento para representação de contexto na análise semântica de conversação [Paper]
(2021-DASFAA, CCF-B) Uma abordagem interativa NL2SQL com estratégia de reutilização [papel]
(2021-NAACL, CCF-B) Pré-treinamento fundamentado em estrutura para texto para SQL [papel]
(2021-ONLP, CCF-B) Picard : analisando de forma incremental para decodificação auto-regressiva restrita dos modelos de linguagem [Paper] [Código]
(2021-ICLR, CCF-A) GRAPPA : Pré-treinamento de Gramática Gramática para Anima Semântica da Tabela [Paper] [Código]
(2021-ACL, CCF-A) LGESQL : Modelo de texto para SQL aprimorado com gráfico de linha com relações locais e não locais mistas [Paper] [Código]
(2020-INENLP, CCF-B) Dados textuais e tabulares de ponte para análise semântica de texto para domínio cruzado [Paper] [Código]
(2020-ACL, CCF-A) TABERT : Pré-treinamento para compreensão conjunta de dados textuais e tabulares [Paper] [Código]
(2020-ACL, CCF-A) RAT-SQL : Esquema com reconhecimento de relação codificação e vinculação para os analisadores de texto para SQL [Paper] [Código]
(2020-ONMLP, CCF-B) mencionam extração e vinculação para a geração de consultas SQL [papel]
(2020-INENLP, CCF-B) IGSQL : Modelo Neural baseado em gráfico de interação do esquema de banco de dados para geração de texto-para-SQL de dependente de contexto [Paper] [Código]
(2020-ARXIV, Nenhum) Rede de classificação híbrida para texto para SQL [Paper] [Código]
(2019-ARXIV, Nenhum) X-SQL : reforça a representação do esquema com contexto [papel]
(2019-iNLP, CCF-B) Raciocínio global sobre estruturas de banco de dados para análise de texto para SQL [Paper] [Código]
(2019-INENLP, CCF-B) Geração de consulta SQL baseada em edição para questões dependentes de contexto de domínio cruzado [Paper] [Código]
(2019-ACL, CCF-A) Representando a estrutura do esquema com redes neurais gráficas para análise de texto para SQL [Paper] [Código]
(2019-ACL, CCF-A) em direção a Text-to-SQL complexo no banco de dados de domínio cruzado com representação intermediária [Paper] [Código]
(2018-iNemlp, CCF-B) SyntaxSqlNet : Redes de árvores de sintaxe para tarefa complexa e cruzada para domesticar-se-sql [papel] [Código]
(2018-Naacl, CCF-B) TypeSQL : geração de texto para SQL com base no conhecimento baseado no conhecimento [Paper] [Código]
(2017-ARXIV, NENHUM) SQLNET : Gerando consultas estruturadas a partir da linguagem natural sem aprendizado de reforço [Paper] [Código]
Lhama [papel] [código] [Modelo]
Chatglm [Paper] [Código] [Modelo]
Alpaca [Paper] [Código] [Modelo]
Vicuna [Paper] [Código] [Modelo]
Wizardlm [Paper] [Código] [Modelo]
Falcon [Paper] [Código] [Modelo]
Chatglm2 [Paper] [Código] [Modelo]
Baichuan-7b [Code] [Modelo]
Baichuan-13b [código] [Modelo]
Internlm [Paper] [Código] [Modelo]
LLAMA 2 [Paper] [Código] [Modelo]
Código llama [Paper] [Código] [Modelo]
Qwen [Paper] [Código] [Modelo]
Baichuan 2 [Paper] [Código] [Modelo]
Phi-1.5 [Paper] [Modelo]
Mistral-7b [Paper] [Código] [Modelo]
Deepseek [Paper] [Código] [Modelo]
Minicpm [Paper] [Código] [Modelo]
Mixtral-8x22b [Paper] [Código] [Modelo]
Phi-3 [Paper] [Modelo]
LLAMA 3 [Paper] [Código] [Modelo]
QWEN-1.5-110B [Paper] [Código] [Modelo]
QWEN2 [Paper] [Código] [Modelo]
LLAMA 3.1 [Paper] [Código] [Modelo]
Qwen2.5 [Paper] [Código] [Modelo]
LLAMA 3.2 [Paper] [Código] [Modelo]
Tuneing P [Paper] [Código]
Lora [Paper] [Código]
P-tuning V2 [Paper] [Código]
Rlhf [papel] [Código]
RRHF [Paper] [Código]
Qlora [Paper] [Código]
RLTF [Paper] [Código]
RRTF [papel]
Rlaif [papel]
Wikisql [Paper] [Code] [DataSet]
Spider 1.0 [Paper] [Código] [DataSet]
SPARC [Paper] [Código] [DataSet]
Cspider [Paper] [Código] [DataSet]
Cosql [Paper] [Código] [DataSet]
TableQa [Paper] [DataSet]
DUSQL [Paper] [DataSet]
Kaggledbqa [papel] [código] [DataSet]
Chase [Paper] [Código] [DataSet]
Bird-SQL [Paper] [Código] [DataSet]
Bird-SQL Mini-Dev [Paper] [Código] [DataSet]
Spider 2.0 [Paper] [Código] [DataSet]
Excurência de execução (Ex) [Paper]
Correspondência exata (em) [papel]
MINDSQL
Premsql
DB-GPT-HUB
sqlcoder
modal_finetune_sql
Tuneamento eficiente de lhama
Se você achar Text2SQL útil para sua pesquisa ou desenvolvimento, cite o seguinte artigo:
@misc { zhou2024dbgpthub ,
title = { DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models } ,
author = { Fan Zhou and Siqiao Xue and Danrui Qi and Wenhui Shi and Wang Zhao and Ganglin Wei and Hongyang Zhang and Caigai Jiang and Gangwei Jiang and Zhixuan Chu and Faqiang Chen } ,
year = { 2024 } ,
eprint = { 2406.11434 } ,
archivePrefix = { arXiv } ,
primaryClass = { id='cs.DB' full_name='Databases' is_active=True alt_name=None in_archive='cs' is_general=False description='Covers database management, datamining, and data processing. Roughly includes material in ACM Subject Classes E.2, E.5, H.0, H.2, and J.1.' }
}Eosfors
Awesome-AIGC-Tutorials