Inglés |中文版| Papel
Tutoriales y recursos curados para modelos de idiomas grandes, Text2SQL, Text2DSL, Text2API, Text2Vis y más.
Agradecemos calurosamente las contribuciones de todos, ya sea que haya encontrado un error tipográfico, un error, tenga una sugerencia o deseamos compartir un recurso relacionado con LLM+Text2SQL. Para obtener pautas detalladas sobre cómo contribuir, consulte nuestro archivo contribuyente.md.
| Wikisql | Araña Partido exacto (EM) | Araña Ejecución exacta (ex) | PÁJARO Puntuación de eficiencia válida basada en recompensas (R-Ves) | PÁJARO Precisión de la ejecución (ex) | |
|---|---|---|---|---|---|
| ? 1 | 93.0 (2021/05-SEAD+decodificación guiada por ejecución) | 81.5 (2023/11-Miniseek) | 91.2 (2023/11-Miniseek) | 69.36 (2024/08-OpenSearch-SQL, V2 + GPT-4O) | 73.00 (2024/09-Chase-SQL + Géminis) |
| ? 2 | 92.7 (2021/03-SDSQL+decodificación guiada por ejecución) | 74.0 (2022/09-Graphix-3b + Picard) | 86.6 (2023/08-DAIL-SQL + GPT-4 + autoconsistencia) | 68.79 (2024/08-Exsl + Granite-34b-código) | 72.39 (2024/09-Askdata + GPT-4O) |
| ? 3 | 92.5 (2020/11-II-SQL+decodificación guiada por ejecución) | 73.9 (2022/09-CATSQL + GRAPPA) | 86.2 (2023/08-Dail-SQL + GPT-4) | 68.44 (2024/09-Chase-SQL + Géminis) | 72.28 (2024/08-OpenSearch-SQL, V2 + GPT-4O) |
| 4 | 92.2 (2020/03-Hydranet+decodificación guiada por ejecución) | 73.1 (2022/09-Sport + Picard) | 85.6 (2023/10-DPG-SQL + GPT-4 + autocorrección) | 67.41 (2024/07-Distillería + GPT-4O) | 71.83 (2024/07-Distillería + GPT-4O) |
| 5 | 91.9 (Decodificación guiada por ejecución 2020/12 puentes) | 72.9 (2022/05-g³r + lgesql + electra) | 85.3 (2023/04-Din-SQL + GPT-4) | 66.92 (2024/09-Askdata + GPT-4O) | 70.37 (2024/08-Exsl + Granite-34b-código) |
| 6 | 91.8 (2019/08-x-sql+decodificación guiada por ejecución) | 72.4 (2022/08-ResDSQL+T5-1.1-LM100K-XL) | 83.9 (Cadena de pensamiento 2023/07 Hindsight con GPT-4) | 66.39 (2024/08-Insights AI) | 70.26 (2024/08-Insights AI) |
| 7 | 91.4 (2021/03-SDSQL) | 72.4 (2022/05-T5-SR) | 82.3 (2023/06-c3 + chatgpt + shot cero) | 66.25 (2024/05-EXSL + Código de granito-20B) | 70.21 (2024/07-Purple + rojo + GPT-4O) |
| 8 | 91.1 (2020/12 puente) | 72.2 (Lista 2022/12-N-mejor Rerankers + Picard) | 80.8 (Cadena de pensamiento 2023/07 Hindsight con GPT-4 e instrucciones) | 65.70 (2024/07-Recap + Géminis) | 69.03 (2024/07-Recap + Géminis) |
| 9 | 91.0 (2021/04-text2sqlgen + eg) | 72.1 (2021/09-s²SQL + Electra) | 79.9 (2023/02-ResDSQL-3B + NATSQ) | 65.62 (2024/07-Purple + rojo + GPT-4O) | 68.87 (2024/07 bytebrain) |
| 10 | 90.5 (2020/11-seqgensql+eg) | 72.0 (2023/02-ResDSQL-3B + NATSQL) | 78.5 (2022/11-SEAD + PQL) | 63.68 (2024/08-Arcwise + GPT-4O) | 67.86 (2024/05-EXSL + Código de granito-20B) |
(2024-ARXIV) De lenguaje natural al SQL: revisión de sistemas de texto a SQL basados en LLM [documento]
(2024-ARXIV) Modelo de lenguaje grande Mejorado a la generación de texto a SQL: una encuesta [documento]
(2024-ARXIV) Una encuesta de NL2SQL con modelos de idiomas grandes: ¿Dónde estamos y a dónde vamos? [documento] [código]
(2024-ARXIV) Una encuesta sobre el empleo de modelos de idiomas grandes para tareas de texto a SQL [documento]
(2023-VLDB, CCF-A) Una encuesta sobre enfoques de aprendizaje profundo para texto a SQL [documento]
(2022-TKDE, CCF-A) Una encuesta sobre análisis de texto a SQL: conceptos, métodos e direcciones futuras [documento]
(2022-coloing, CCF-B) Avances recientes en texto a SQL: una encuesta de lo que tenemos y lo que esperamos [papel]
(2022-ARXIV) TEXTO DE IDIGLES NATURALES DE APRENDIZAJE DEL APRENDIZAJE A CONVERSIÓN DE CONSULTA DE SQL: Una encuesta [documento]
(2024-ARXIV, Ninguno) Chase-SQL : selección de candidatos optimizado de razonamiento y preferencia de múltiples rutas en texto a SQL [documento]
(2024-ARXIV, NINGUNO) E-SQL : enlace de esquema directo a través del enriquecimiento de preguntas en texto a SQL [documento] [código]
(2024-ARXIV, NINGUNO) Destilería : ¿la muerte del esquema vinculado? Texto a SQL en la era de los modelos de idiomas bien razonados [papel]
(2024-ARXIV, NINGUNO) DB-GPT-HUB : hacia Benchmarking Open Benchmarking a SQL Empoderado por modelos de idiomas grandes [documento] [Código]
(2024-ARXIV, NINGUNO) SuperSQL : El amanecer del lenguaje natural a SQL: ¿Estamos completamente listos? [documento] [código]
(2024-ARXIV, NINGUNO) Ajedrez : arnés contextual para una síntesis de SQL eficiente [documento] [código]
(2023-ARXIV, NINGUNO) MAC-SQL : un marco colaborativo de múltiples agentes para texto a SQL [documento] [código]
(2023-ARXIV, NINGUNO) DBCᴏᴘɪʟᴏᴛ : Escala de consulta de lenguaje natural a bases de datos masivas [documento] [código]
(2023-ARXIV, NINGUNO) TEXTO A SQL ENFORMADO POR MODELOS DE LENGUA GRANDE: una evaluación de referencia [documento] [código]
(2023-AAAI 2023, CCF-A) RessQL : enlace de esquema de desacoplamiento y análisis de esqueleto para texto a SQL [papel] [código]
(2023-ARXIV, ninguno) ¿LLM ya puede servir como interfaz de base de datos? Un gran banco para la base de datos a gran escala de texto a SQLS [documento] [Código]
(2023-ARXIV, NINGUNO) DIN-SQL : aprendizaje en contexto descompuesto de texto a SQL con autocorrección [documento] [código]
(2023-ARXIV, NINGUNO) Una evaluación integral de la capacidad de texto de texto cero de chatgpt [documento] [código]
(2023-ICLR, CCF-A) Modelos de lenguaje vinculante en lenguajes simbólicos [documento] [código]
(2023-SIGMOD, CCF-A) Traducción de texto a SQL de pocos disparos utilizando estructura y aprendizaje indicador de contenido [documento] [código]
(2023-ICASSP, CCF-B) T5-SR : una estrategia de decodificación SEQ-to-seq unificada para el análisis semántico [documento]
(2022-ACL, CCF-A) S 2 SQL : inyectando sintaxis al codificador de gráfico de interacción de preguntas de preguntas para analizadores de texto a SQL [papel]
(2022-NAACL, CCF-B) SEAD : Generación de texto a SQL de extremo a extremo con Denoising [documento] de extremo a SQL
(2022-EMNLP, CCF-B) Estrella : pre-entrenamiento guiado SQL para el análisis de texto a SQL dependiente del contexto [documento] [código]
(2022-EMNLP, CCF-B) RASAT : Integración de estructuras relacionales en el modelo SEQ2SEQ previamente pretrado para Text-to SQL [Paper] [Código]
(2022-EMNLP, CCF-B) CQR-SQL : reformulación de preguntas conversacionales mejoradas de texto a SQL dependiente del contexto [documento]
(2022-ACL, CCF-A) HIE-SQL : Información de la historia mejorada Network para el análisis semántico de texto a SQL dependiente del contexto [documento]
(2022-ARXIV, Ninguno) Importancia de sintetizar datos de alta calidad para el análisis de texto a SQL [documento]
(2021-ACL, CCF-A) Modelado de diálogo desacoplado y análisis semántico para texto múltiple a SQL [papel]
(2021-ARXIV, Ninguno) Preste más atención a la historia: una estrategia de modelado de contexto para texto de conversación a SQL [documento] [código]
(2021-ICLR, CCF-A) Puntuación : pretruento para la representación del contexto en el análisis semántico conversacional [documento]
(2021-DASFAA, CCF-B) Un enfoque interactivo NL2SQL con estrategia de reutilización [documento]
(2021-NAACL, CCF-B) Pretratenamiento fundamentado para la estructura para texto a SQL [papel]
(2021-EMMNLP, CCF-B) Picard : análisis de forma incremental para una decodificación automática restringida de los modelos de idioma [papel] [código]
(2021-ICLR, CCF-A) GRAPPA : pretruento de gramática-acoplada para el análisis semántico de tabla [documento] [código]
(2021-ACL, CCF-A) LGESQL : Modelo de texto a SQL mejorado de gráfico de línea con relaciones locales y no locales mixtas [documento] [código]
(2020-EMMNLP, CCF-B) Datos textuales y tabulares de puente para el análisis semántico de texto de dominio a SQL [documento] [código]
(2020-ACL, CCF-A) Tabert : Pretronamiento para la comprensión conjunta de datos textuales y tabulares [documento] [Código]
(2020-ACL, CCF-A) RAT-SQL : Codificación de esquema de relación y vinculación para analizadores de texto a SQL [documento] [código]
(2020-EMNLP, CCF-B) Mencione extracción y enlace para la generación de consultas SQL [documento]
(2020-EMNLP, CCF-B) IGSQL : Modelo neural basado en gráficos de interacción de esquema de base de datos para generación de texto a SQL dependiente del contexto [papel] [código]
(2020-ARXIV, Ninguno) Red de clasificación híbrida para texto a SQL [documento] [código]
(2019-ARXIV, NINGUNO) X-SQL : Reforzar la representación del esquema con contexto [documento]
(2019-EMNLP, CCF-B) Razonamiento global sobre estructuras de bases de datos para análisis de texto a SQL [documento] [código]
(2019-EMNLP, CCF-B) Generación de consultas SQL basada en la edición para preguntas dependientes del contexto del dominio entre dominios [documento] [Código]
(2019-ACL, CCF-A) que representa la estructura de esquema con redes neuronales gráficas para análisis de texto a SQL [papel] [código]
(2019-ACL, CCF-A) hacia el texto complejo a SQL en la base de datos de dominio cruzado con representación intermedia [documento] [código]
(2018-EMNLP, CCF-B) Syntaxsqlnet : Networks de árbol de sintaxis para tarea compleja y de intermedimiento cruzado a SQL [documento] [código]
(2018-NAACL, CCF-B) TIPOSQL : Generación de texto neuronal a SQL basado en el conocimiento [documento] [Código]
(2017-ARXIV, NINGUNO) SQLNET : Generación de consultas estructuradas del lenguaje natural sin aprendizaje de refuerzo [papel] [código]
Llama [documento] [código] [modelo]
Chatglm [papel] [código] [modelo]
Alpaca [Paper] [Código] [Modelo]
Vicuna [documento] [código] [modelo]
Wizardlm [documento] [código] [modelo]
Falcon [Paper] [Código] [Modelo]
Chatglm2 [papel] [código] [modelo]
Baichuan-7b [código] [modelo]
Baichuan-13b [código] [modelo]
Internlm [Paper] [Código] [Modelo]
Llama 2 [Paper] [Código] [Modelo]
Code Llama [Paper] [Código] [Modelo]
Qwen [documento] [código] [modelo]
Baichuan 2 [Paper] [Código] [Modelo]
Phi-1.5 [Documento] [Modelo]
Mistral-7B [Paper] [Código] [Modelo]
Deepseek [documento] [código] [modelo]
Minicpm [documento] [código] [modelo]
Mixtral-8x22b [papel] [código] [modelo]
Phi-3 [documento] [modelo]
Llama 3 [documento] [código] [modelo]
Qwen-1.5-110b [documento] [código] [modelo]
Qwen2 [Paper] [Código] [Modelo]
Llama 3.1 [Paper] [Código] [Modelo]
Qwen2.5 [Paper] [Código] [Modelo]
Llama 3.2 [Paper] [Código] [Modelo]
P-ajust [documento] [código]
Lora [documento] [código]
P-Tuning V2 [Paper] [Código]
RLHF [Paper] [Código]
RRHF [Paper] [Código]
Qlora [documento] [código]
Rltf [documento] [código]
Rrtf [papel]
Rlaif [papel]
Wikisql [documento] [código] [conjunto de datos]
Spider 1.0 [Paper] [Código] [DataSet]
SPARC [Paper] [Código] [DataSet]
Cspider [documento] [código] [DataSet]
COSQL [Paper] [Código] [DataSet]
Tableqa [documento] [conjunto de datos]
Dusql [Paper] [DataSet]
Kaggledbqa [documento] [código] [conjunto de datos]
Chase [Paper] [Código] [DataSet]
Bird-SQL [Paper] [Código] [DataSet]
Bird-SQL mini-dev [Paper] [Código] [DataSet]
Spider 2.0 [Paper] [Código] [DataSet]
Precisión de ejecución (ex) [documento]
Match exacta (EM) [papel]
mentalsql
Premsql
DB-GPT-HUB
sqlcoder
modal_finetune_sql
Ajuste de eficiencia
Si encuentra útil Text2SQL para su investigación o desarrollo, cite el siguiente documento:
@misc { zhou2024dbgpthub ,
title = { DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models } ,
author = { Fan Zhou and Siqiao Xue and Danrui Qi and Wenhui Shi and Wang Zhao and Ganglin Wei and Hongyang Zhang and Caigai Jiang and Gangwei Jiang and Zhixuan Chu and Faqiang Chen } ,
year = { 2024 } ,
eprint = { 2406.11434 } ,
archivePrefix = { arXiv } ,
primaryClass = { id='cs.DB' full_name='Databases' is_active=True alt_name=None in_archive='cs' is_general=False description='Covers database management, datamining, and data processing. Roughly includes material in ACM Subject Classes E.2, E.5, H.0, H.2, and J.1.' }
}eosphoros
Impresionante-aigc-tutorials