Технология преобразования текста в SQL направлена на упрощение запросов к базе данных, чтобы обычные пользователи могли легко получать данные, не изучая язык SQL. Однако перед лицом все более сложных структур баз данных точное преобразование естественного языка в команды SQL по-прежнему остается сложной задачей. Исследовательские группы из Южно-Китайского технологического университета и Университета Цинхуа предложили инновационное решение — MAG-SQL, которое значительно повышает точность и эффективность преобразования текста в SQL за счет межагентного взаимодействия.
В области естественного языка (NLP) быстро развивается технология text-to-SQL (Text-to-SQL). Эта технология позволяет обычным пользователям легко выполнять запросы к базам данных с использованием японского языка без необходимости освоения профессиональных языков программирования. такие как SQL. Однако, поскольку структура базы данных становится все более сложной, то, как точно преобразовать естественный язык в команды SQL, становится большой проблемой.
Исследовательские группы из Южно-Китайского технологического университета и Университета Цинхуа недавно предложили новое решение — MAG-SQL (Multiple Intelligence Generating Model), целью которого является улучшение эффекта преобразования текста в SQL. Этот метод использует сотрудничество нескольких агентов и направлен на повышение точности генерации SQL.
Принцип работы MAG-SQL весьма умен. Основные компоненты включают «Компоновщик мягкого режима», «Целевой условный преобразователь», «Генератор суб-SQL» и «Модификатор суб-SQL». Во-первых, компоновщик мягкого режима отфильтрует столбцы базы данных, наиболее соответствующие запросу, тем самым уменьшая ненужное информационное вмешательство и повышая точность генерации команд SQL. Затем условный декомпозер разбивает сложный запрос на более мелкие подзапросы для упрощения обработки.

Генератор суб-SQL затем генерирует суб-SQL-запросы на основе предыдущих результатов, обеспечивая возможность постепенного уточнения команд SQL. Наконец, корректор суб-SQL отвечает за исправление сгенерированных ошибок SQL, что еще больше повышает общую точность. Этот многоэтапный метод обработки позволяет MAG-SQL хорошо работать в сложных базах данных.
В недавних тестах MAG-SQL очень хорошо показал себя на наборе данных BIRD. При использовании модели GPT-4 система достигла точности выполнения 61,08%, что значительно улучшилось по сравнению с 46,35% традиционной GPT-4. Даже при использовании GPT-3.5 точность MAG-SQL достигает 57,62%, превосходя предыдущий метод MAC-SQL. Кроме того, MAG-SQL одинаково хорошо работает и с другим сложным набором данных, Spider, демонстрируя свою хорошую универсальность.
Внедрение MAG-SQL не только повышает точность преобразования текста в SQL, но и дает новые идеи для решения сложных запросов. Эта многоагентная структура благодаря многократному и итеративному уточнению значительно расширила возможности больших языковых моделей в практических приложениях, особенно при работе со сложными базами данных и сложными запросами.
Бумажный вход: https://arxiv.org/pdf/2408.07930.
Выделять:
? ** Повышенная точность **: MAG-SQL достиг точности выполнения 61,08 % для набора данных BIRD, что намного превышает 46,35 % у традиционного GPT-4.
**Многоагентное сотрудничество**. Этот метод использует несколько агентов для разделения труда и сотрудничества, что делает процесс генерации SQL более эффективным и точным.
**Широкие перспективы применения**: MAG-SQL также хорошо работает с другими наборами данных (например, Spider), демонстрируя хорошее удобство использования и применимость.
Многоагентная среда MAG-SQL значительно повысила производительность технологии преобразования текста в SQL. Ее превосходная производительность при работе со сложными наборами данных указывает на огромный потенциал этой технологии в практических приложениях и прокладывает путь для будущих инноваций в методах запросов к базе данных. .Открывает новые направления.