На пересечении науки и техники графики, как мощный инструмент для выражения сложных отношений, все больше становятся центром исследователей. Графики играют незаменимую роль в химическом молекулярном дизайне или анализе социальной сети. Тем не менее, как эффективно и гибко генерировать графику, всегда является очень сложной проблемой. Недавно команда исследований в Университете Тафтса, Северо-Восточном университете и Университете Корнелля сотрудничала для запуска авторегрессивной модели под названием «Генеративный график» предварительно обученного трансформатора (G2PT), направленной на то, чтобы переопределить, как генерируются и представлены графики.
В отличие от традиционных моделей генерации графиков, которые полагаются на матрицу смежности, G2PT представляет метод токенизации на основе последовательностей. Этот метод в полной мере использует редкость графика путем разложения графика на наборы узлов и наборы краев, тем самым значительно повышая эффективность вычислительной техники. Инновация G2PT заключается в том, что он может постепенно генерировать графики, как на естественном языке и завершать всю конструкцию графика, предсказав следующий токен. Исследования показывают, что это сериализованное представление не только уменьшает количество токенов, но и улучшает качество поколения.
Адаптивность и масштабируемость G2PT впечатляют. С помощью технологии тонкой настройки он демонстрирует отличную производительность в таких задачах, как целенаправленное генерация графиков и прогноз атрибутов графика. Например, в дизайне лекарственного средства G2PT может генерировать молекулярные карты со специфическими физико -химическими свойствами. Кроме того, путем извлечения графического встраивания предварительно обученных моделей, G2PT также показывает превосходство на многочисленных наборах данных прогнозирования атрибутов.
В сравнительных экспериментах G2PT показал значительно лучше, чем существующие современные модели на нескольких наборах данных. Его производительность была высоко признана с точки зрения создания достоверности, уникальности и сопоставления распределений молекулярных атрибутов. Исследователи также проанализировали влияние модели и шкалы данных на производительность генерации.
Хотя G2PT демонстрирует выдающиеся возможности во многих задачах, исследователи также отметили, что чувствительность к порядку генерации может означать, что различные графические домены требуют разных стратегий оптимизации порядка. Ожидается, что будущие исследования будут дополнительно изучить более общие и выразительные конструкции последовательности.
Появление G2PT не только принесло инновационные методы в области генерации графиков, но и заложило прочную основу для исследования и применения соответствующих областей. Ожидается, что с постоянным развитием технологий G2PT реализует свой потенциал в большем количестве областей и способствует дальнейшей разработке технологии генерации графиков.