英語|中文版|紙
大規模な言語モデル、text2SQL、text2dsl、text2api、text2visなどのためのキュレーションされたチュートリアルとリソース。
タイプミス、バグ、提案があるか、LLM+Text2SQLに関連するリソースを共有したいかにかかわらず、すべての人からの貢献を歓迎します。貢献方法に関する詳細なガイドラインについては、contributing.mdファイルを参照してください。
| wikisql | スパイダー 正確な一致(em) | スパイダー 正確な実行(ex) | 鳥 報酬ベースの有効な効率スコア(R-ves) | 鳥 実行精度(EX) | |
|---|---|---|---|---|---|
| ?1 | 93.0 (2021/05-sead+実行ガイドデコード) | 81.5 (2023/11-mineek) | 91.2 (2023/11-mineek) | 69.36 (2024/08-OpenSearch-SQL、V2 + GPT-4O) | 73.00 (2024/09-CHASESQL + GEMINI) |
| ?2 | 92.7 (2021/03-SDSQL+実行ガイド付きデコード) | 74.0 (2022/09-graphix-3b + picard) | 86.6 (2023/08-DAIL-SQL + GPT-4 +自己整合性) | 68.79 (2024/08-EXSL + GRANITE-34B-CODE) | 72.39 (2024/09-askdata + gpt-4o) |
| ?3 | 92.5 (2020/11-IIE-SQL+実行ガイド付きデコード) | 73.9 (2022/09-catsql + grappa) | 86.2 (2023/08-DAIL-SQL + GPT-4) | 68.44 (2024/09-CHASESQL + GEMINI) | 72.28 (2024/08-OpenSearch-SQL、V2 + GPT-4O) |
| 4 | 92.2 (2020/03-Hydranet+実行ガイド付きデコード) | 73.1 (2022/09-ship + Picard) | 85.6 (2023/10-DPG-SQL + GPT-4 +自己修正) | 67.41 (2024/07-DISTILLERY + GPT-4O) | 71.83 (2024/07-DISTILLERY + GPT-4O) |
| 5 | 91.9 (2020/12-ブリッジ+実行ガイド付きデコード) | 72.9 (2022/05-g³r + LGESQL + Electra) | 85.3 (2023/04-DIN-SQL + GPT-4) | 66.92 (2024/09-askdata + gpt-4o) | 70.37 (2024/08-EXSL + GRANITE-34B-CODE) |
| 6 | 91.8 (2019/08-X-SQL+実行ガイド付きデコード) | 72.4 (2022/08-ResdSQL+T5-1.1-LM100K-XL) | 83.9 (2023/07 GPT-4を使用したHindSightの思考チェーン) | 66.39 (2024/08-Insights AI) | 70.26 (2024/08-Insights AI) |
| 7 | 91.4 (2021/03-SDSQL) | 72.4 (2022/05-T5-SR) | 82.3 (2023/06-C3 + chatgpt + zero-shot) | 66.25 (2024/05-exsl + granite-20b-code) | 70.21 (2024/07-PURPLE + RED + GPT-4O) |
| 8 | 91.1 (2020/12-ブリッジ) | 72.2 (2022/12-n-bestリストRerankers + Picard) | 80.8 (2023/07 GPT-4および指示を含むHindsightの思考チェーン) | 65.70 (2024/07-Recap + Gemini) | 69.03 (2024/07-Recap + Gemini) |
| 9 | 91.0 (2021/04-text2sqlgen + eg) | 72.1 (2021/09-s²sql + electra) | 79.9 (2023/02-Resdsql-3b + natsq) | 65.62 (2024/07-PURPLE + RED + GPT-4O) | 68.87 (2024/07-bytebrain) |
| 10 | 90.5 (2020/11-seqgensql+eg) | 72.0 (2023/02-Resdsql-3b + natsql) | 78.5 (2022/11-sead + pql) | 63.68 (2024/08-arcwise + gpt-4o) | 67.86 (2024/05-exsl + granite-20b-code) |
(2024-ARXIV)自然言語からSQLへ:LLMベースのテキストからSQLシステムのレビュー[Paper]
(2024-ARXIV)大規模な言語モデルの強化テキストからSQLの生成:調査[論文]
(2024-ARXIV)大規模な言語モデルを使用したNL2SQLの調査:私たちはどこにいて、どこに行くのか? [紙] [コード]
(2024-ARXIV)テキスト間タスクに大規模な言語モデルの採用に関する調査[Paper]
(2023-VLDB、CCF-A
(2022-TKDE、CCF-A)テキスト間解析に関する調査:概念、方法、将来の方向[Paper]
(2022-Coloing、CCF-B)テキストからSQLへの最近の進歩:私たちが持っているものと私たちが期待していることの調査[論文]
(2022-ARXIV)深い学習駆動型の自然言語テキストからSQLクエリ変換:調査[論文]
(2024-Arxiv、なし) Chase-SQL :マルチパスの推論と優先候補テキストへの最適化された候補の選択[Paper]
(2024-Arxiv、なし) e-sql :テキストからSQLの質問濃縮を介してリンクする直接スキーマ[Paper] [Code]
(2024-Arxiv、なし)蒸留所:スキーマの死の死?適切な言語モデルの時代のテキストからSQL [紙]
(2024-ARXIV、なし) DB-GPT-HUB :大規模な言語モデルによって権限を与えられたテキストからSQLのオープンベンチマークに向けて[Paper] [Code]
(2024-Arxiv、なし) SuperSQL :SQLへの自然言語の夜明け:完全に準備ができていますか? [紙] [コード]
(2024-Arxiv、なし)チェス:効率的なSQL合成のためのコンテキストハーネス[Paper] [Code]
(2023-Arxiv、なし) Mac-SQL :Text-to-SQLのためのマルチエージェントの共同フレームワーク[Paper] [Code]
(2023-ARXIV、なし) DBCᴏᴘɪʟᴏᴛ :大規模なデータベースへの自然言語クエリのスケーリング[Paper] [Code]
(2023-ARXIV、なし)大規模な言語モデルによって力を与えられたテキストからSQL:ベンチマーク評価[Paper] [Code]
(2023-AAAI 2023、CCF-A) ResdsQL :テキスト間のスキーマのリンクとスケルトン解析スキーマ[Paper] [Code]
(2023-Arxiv、なし)LLMはすでにデータベースインターフェイスとして機能しますか?大規模なデータベースに接地されたテキストからSQLSの大きなベンチ[Paper] [コード]
(2023-Arxiv、なし) din-sql :自己修正を使用したテキストからSQLのテキストへの分解されたコンテキストの学習[Paper] [Code]
(2023-Arxiv、なし)ChatGptのゼロショットテキストからSQL機能の包括的な評価[Paper] [Code]
(2023-ICLR、CCF-A)シンボリック言語の結合言語モデル[Paper] [Code]
(2023-SIGMOD、CCF-A)構造とコンテンツを使用した少数のテキストからSQLへの翻訳迅速な学習[Paper] [Code]
(2023-ICASSP、CCF-B) T5-SR :セマンティック解析のための統一されたSEQからSEQへのデコード戦略[Paper]
(2022-ACL、CCF-A) S 2 SQL :テキスト間パーサー用の質問シーマインタラクショングラフエンコーダーに構文を挿入[Paper]
(2022-NAACL、CCF-B) SEAD :スキーマを認識した除去を伴うエンドツーエンドのテキストからSQLの生成[論文]
(2022-mendlp、ccf-b)星:SQLガイド付きテキストからSQLへのコンテキストへの移行前トレーニング[Paper] [Code]
(2022-mednlp、ccf-b) rasat :テキストツースクールのリレーショナル構造を前処理されたseq2seqモデルに統合する[Paper] [code]
(2022-mendlp、ccf-b) cqr-sql :会話型質問再生コンテキスト依存のテキストからSQLパーサーの強化[Paper]
(2022-ACL、CCF-A) HIE-SQL :履歴情報強化されたコンテキスト依存のテキストからSQLのセマンティック解析のためのネットワーク[Paper]
(2022-Arxiv、なし)テキスト間解析のための高品質データを合成することの重要性[Paper]
(2021-ACL、CCF-A)マルチターンテキストのためのデカップされたダイアログモデリングとセマンティック解析[Paper]
(2021-Arxiv、なし)歴史にもっと注意を払う:会話のテキストからSQLへのコンテキストモデリング戦略[Paper] [Code]
(2021-ICLR、CCF-A)スコア:会話のセマンティック解析におけるコンテキスト表現のための事前トレーニング[Paper]
(2021-DASFAA、CCF-B)再利用戦略を備えたインタラクティブなNL2SQLアプローチ[Paper]
(2021-NAACL、CCF-B)テキストからSQLへの構造接地された事前削除[論文]
(2021-emnllp、ccf-b) picard :言語モデルからの制約された自動回帰デコードのために段階的に解析する[Paper] [Code]
(2021-ICLR、CCF-A) Grappa :テーブルセマンティック解析のための文法上熟成プリトレーニング[Paper] [Code]
(2021-ACL、CCF-A) LGESQL :系統グラフの強化されたテキストからSQLモデルが混合された局所関係と非ローカルな関係[Paper] [Code]
(2020-mednlp、ccf-b)クロスドメインテキストのテキストとSQLのセマンティック解析のためのテキストおよび表形式データの橋渡し[Paper] [Code]
(2020-ACL、CCF-A) TABERT :テキストと表形式のデータの共同理解のための前orains [Paper] [Code]
(2020-ACL、CCF-A) RAT-SQL :テキストツースクールパーサーのエンコードとリンクの関係認識スキーマ[Paper] [Code]
(2020-mednlp、ccf-b)抽出とSQLクエリ生成のリンクに言及します[Paper]
(2020-mednlp、ccf-b) igsql :コンテキスト依存のテキストからSQL生成のためのデータベーススキーマインタラクショングラフベースのニューラルモデル[Paper] [code]
(2020-ARXIV、なし)テキストツースクールのハイブリッドランキングネットワーク[Paper] [Code]
(2019-Arxiv、なし) X-SQL :コンテキストでスキーマ表現を強化[Paper]
(2019-emsnlp、ccf-b)テキスト間解析のためのデータベース構造に関するグローバルな推論[Paper] [code]
(2019-emnlp、ccf-b)クロスドメインのコンテキスト依存の質問のための編集ベースのSQLクエリ生成[Paper] [Code]
(2019-ACL、CCF-A)テキストからSQLの解析のためのグラフニューラルネットワークを使用したスキーマ構造を表す[Paper] [Code]
(2019-ACL、CCF-A)中間表現を備えたクロスドメインデータベースの複雑なテキストからSQLに向けて[Paper] [Code]
(2018-emnllp、ccf-b) syntaxsqlnet :複雑およびクロスドマインテキストツースクールタスクの構文ツリーネットワーク[Paper] [Code]
(2018-NAACL、CCF-B) TypeQL :知識ベースのタイプ認識テキストからSQLの生成[Paper] [Code]
(2017-ARXIV、なし) SQLNET :強化のない自然言語から構造化されたクエリを生成します[Paper] [Code]
llama [Paper] [code] [Model]
chatglm [Paper] [code] [Model]
Alpaca [Paper] [Code] [Model]
Vicuna [Paper] [Code] [Model]
wizardlm [Paper] [code] [Model]
ファルコン[紙] [コード] [モデル]
Chatglm2 [Paper] [Code] [Model]
baichuan-7b [code] [モデル]
baichuan-13b [code] [モデル]
internlm [Paper] [code] [Model]
llama 2 [Paper] [code] [Model]
コードllama [Paper] [code] [Model]
Qwen [Paper] [Code] [Model]
Baichuan 2 [Paper] [Code] [Model]
PHI-1.5 [紙] [モデル]
Mistral-7B [Paper] [Code] [Model]
Deepseek [Paper] [Code] [Model]
minicpm [Paper] [code] [Model]
mixtral-8x22b [Paper] [code] [Model]
PHI-3 [紙] [モデル]
llama 3 [紙] [コード] [モデル]
QWEN-1.5-110B [Paper] [Code] [Model]
QWEN2 [Paper] [Code] [Model]
llama 3.1 [Paper] [code] [Model]
QWEN2.5 [Paper] [Code] [Model]
Llama 3.2 [Paper] [Code] [Model]
p-tuning [paper] [code]
lora [紙] [コード]
p-tuning v2 [Paper] [code]
RLHF [Paper] [コード]
RRHF [Paper] [コード]
qlora [紙] [コード]
RLTF [Paper] [コード]
rrtf [紙]
rlaif [紙]
wikisql [Paper] [code] [データセット]
スパイダー1.0 [紙] [コード] [データセット]
SPARC [Paper] [code] [Dataset]
cspider [Paper] [code] [Dataset]
cosql [Paper] [code] [dataset]
tableqa [紙] [データセット]
dusql [Paper] [データセット]
kaggledbqa [Paper] [code] [dataset]
Chase [Paper] [code] [Dataset]
Bird-SQL [Paper] [code] [Dataset]
bird-sql mini-dev [paper] [code] [dataset]
スパイダー2.0 [紙] [コード] [データセット]
実行精度(Ex)[Paper]
正確な一致(em)[紙]
MindSQL
premsql
db-gpt-hub
sqlcoder
MODAL_FINETUNE_SQL
ラマ効率の高い調整
Text2SQL研究や開発に役立つと思われる場合は、次の論文を引用してください。
@misc { zhou2024dbgpthub ,
title = { DB-GPT-Hub: Towards Open Benchmarking Text-to-SQL Empowered by Large Language Models } ,
author = { Fan Zhou and Siqiao Xue and Danrui Qi and Wenhui Shi and Wang Zhao and Ganglin Wei and Hongyang Zhang and Caigai Jiang and Gangwei Jiang and Zhixuan Chu and Faqiang Chen } ,
year = { 2024 } ,
eprint = { 2406.11434 } ,
archivePrefix = { arXiv } ,
primaryClass = { id='cs.DB' full_name='Databases' is_active=True alt_name=None in_archive='cs' is_general=False description='Covers database management, datamining, and data processing. Roughly includes material in ACM Subject Classes E.2, E.5, H.0, H.2, and J.1.' }
}エンホロス
Awesome-Aigc-Tutorials