tianchi_nl2sql скачать - tianchi_nl2sql исходный код скачать

tianchi_nl2sql

Другой исходный код

1.0.0

Скачать

Первый китайский вызов NL2SQL

Конкурсная ссылка

Организатор набора данных был обнародован и может быть загружен по адресу https://github.com/zhuiyitechnology/tableqa

Среда запуска кода до конца статьи

счет

План, принятый в этом проекте, занимает пятое онлайн в реванше и третьем в окончательных результатах.

Код под основной филиалом представлен в форме ноутбука Юпитера. В целях обучения и общения исходный код был отсортирован на определенную сумму и не будет полностью воспроизводит результаты онлайн, но эффект не будет намного хуже.

Model1.ipynb и model2.ipynb в каталоге кода - это процессы моделирования, а каталог nl2sql/utils содержит некоторые основные функции и структуры данных, необходимые для этой задачи.

Благодарности

Благодаря Sun Ningyuan of Zhuiyi Technology за предоставление подробного предварительного обучения для этого конкурса
Благодаря Su Jianlin, исследователю Zhuiyi Technology и научному космическому блоггеру, за то, что он поделился большим количеством высококачественных постов в блоге на NLP. Эта схема вдохновлена статьей «NL2SQL», основанной на модели BERT NL2SQL: краткая базовая линия ». Реализация оптимизатора радама, используемого в проекте, поступает непосредственно из проекта Su Jianlin Keras_radam
Благодаря проекту с открытым исходным кодом Cyberzhg Keras-Bert мы использовали Keras-Bert для создания нашей модели в этом конкурсе.
Благодаря китайскому проекту Берт-WWM в Объединенной лаборатории Iflytek мы использовали их BERT-wwm, Chinese предварительно обученные параметры модели в этом конкуренте.

фон

Первая китайская задача NL2SQL использует табличные данные из финансов и общих областей в качестве источников данных для обеспечения соответствующих пар между естественным языком и операторами SQL, отмеченными на этой основе. Мы надеемся, что игроки могут использовать данные для обучения моделей, которые могут точно преобразовать естественный язык в SQL.

Вход в модель - это таблица «Вопрос +», а структура SQL - вывод, которая соответствует оператору SQL.

в

sel - это список, представляющий столбец, выбранный оператором SELECT
agg - это список, соответствующий sel , указывающий, какая операция агрегации выполняется в столбце, например, сумме, максимум, мин и т. Д.
conds - это список, представляющий серию условий в утверждении WHERE . Каждое условие состоит из тройного, состоящего из (столбцов условий, операторов состояния, значений условий).
cond_conn_op - это int, представляющий параллельные отношения между условиями в conds , которые могут быть и или или или или или

План введения

Мы делаем простое преобразование оригинальной этикетки

MERGE agg с sel , делайте прогнозы для каждого столбца в таблице в agg , а новая категория NO_OP указывает, что столбец не выбран
Разделите conds на две части: conds_ops и conds_vals . Причина этого состоит в том, чтобы сделать прогнозы в двух шагах. Модель сначала предсказывает, какие столбцы и операторы будут выбраны conds , а затем другая модель предсказывает значение сравнения выбранных столбцов.

Модель 1

Модель 1 Подключите вопрос с последовательным заголовком, добавив специальный маркер, TEXT или REAL перед каждым столбцом. Эти два специальных токена могут быть заменены двумя неподготовленными токенами, зарезервированными Бертом.

Архитектура модели 1 заключается в следующем:

Модель 2

Модель 2 отвечает за прогноз cond_val . Наша идея состоит в том, чтобы перечислить cond_op и cond_val на основе cond_col выбранной моделью 1, и генерировать серию комбинаций кандидатов, рассматривая эти комбинации как проблемы с множественной бинарной классификацией.

Архитектура модели 2 заключается в следующем:

Наконец, объедините прогнозы модели 2 для некоторых комбинаций кандидатов

Некоторые попытки разведки при обучении модели

Для получения подробной информации, пожалуйста, смотрите нашу окончательную защиту PPT для оптимизации в модельном обучении и некоторые успешные и неудачные идеи.

Среда работы по коду

Глубокая структура обучения: Tensorflow, Keras

См. TEDS.TXT для конкретных версий

Более удобный способ сделать это - запустить его в Docker. Следующее изображение Docker использовалось в конкурсе

Репозиторий	ЯРЛЫК	Идентификатор изображения
Tensorflow/Tensorflow	Ночной-гп-пи-3-юпитер	6E60684E9AA4

Поскольку мне нужно использовать Python3.6, я использую изображение Tensorflow Nightly Build. Я прошел изображение, которое я использовал во время соревнований в концентраторе Docker, который можно получить с помощью следующей команды.

docker pull beader/tensorflow:nightly-gpu-py3-jupyter

Расширять

Дополнительная информация

Версия 1.0.0
Тип Другой исходный код
Время обновления 2025-04-18
размер 2.09MB
От Github

Связанные приложения

OpenCore_NO_ACPI_Build

2024-11-13
nspanel_pro_tools_apk

2024-11-12
YuQue_Book_Download

2024-11-12
zkwork_aleo_gpu_worker

2024-11-11
nextcloud_share_url_downloader

2024-11-01
Бесплатная версия механизма анализа данных Lihua 3.0_search_navigation_collection_public Opinion_ranking_api

2022-06-28

tianchi_nl2sql

Первый китайский вызов NL2SQL

счет

Благодарности

фон

План введения

Модель 1

Модель 2

Некоторые попытки разведки при обучении модели

Среда работы по коду

OpenCore_NO_ACPI_Build

nspanel_pro_tools_apk

YuQue_Book_Download

zkwork_aleo_gpu_worker

nextcloud_share_url_downloader

Бесплатная версия механизма анализа данных Lihua 3.0_search_navigation_collection_public Opinion_ranking_api

chat.petals.dev

GPT Prompt Templates

GPTyped

Google Dorks

shepherd

mongo express

Google Dorks

shepherd

mongo express