Бумажный чтение-конвай
Список чтения бумаги в разговорном ИИ, в основном охватывающий системы диалога и генерацию естественного языка . Этот репозиторий постоянно обновляется? ...
- Глубокое обучение в NLP
- Системы диалога
- Опрос по диалогу
- Разговорные LLMS
- Мультимодальный диалог
- Расположенный и воплощенный диалог
- Визуально обоснованный диалог
- Упреждающий диалог
- Разное проактивного диалога
- Целевой диалог
- Необоялчный диалог (убеждение и переговоры)
- Персонализированный диалог
- Основанный на персонажах диалог
- Диалог с личности
- Основанный на личности диалог
- Эмоциональный диалог
- Эмоциональная поддержка диалога
- Эмпатический диалог
- Рекомендационный диалог и CRS
- Знание диалог
- Ориентированный на задачу диалог
- Открытый домен диалог
- Долгосрочный диалог
- Генерация ответов
- Оценка диалога
- Диалог Разное.
- Генерация естественного языка
- Опрос о NLG
- Теории и методы NLG
- Диффузионные модели для NLG
- Контролируемое поколение
- Текстовое планирование
- Декодирование алгоритмов
- NLG Оценка
Глубокое обучение в NLP
- Inlp : «Интерактивная обработка естественного языка». arxiv (2023) [бумага]
- Увеличение данных : «Обзор подходов к увеличению данных для НЛП». ACL-сайты (2021) [бумага]
- Подсказка : «перед поездкой, быстро и прогнозируйте: систематический обзор методов подсказки в обработке естественного языка». arxiv (2021) [бумага]
- NLP World Scope : «Опыт основания языка». EMNLP (2020) [бумага]
- Transformer-XL : «Transformer-XL: внимательные языковые модели за пределами контекста с фиксированной длиной». ACL (2019) [Paper] [Код]
- Трансформер : «Внимание - это все, что вам нужно». Neurips (2017) [Paper] [Code-Official] [Code-TF] [Code-Py]
- VAE : «Введение в вариационные автоэнкодории». Arxiv (2019) [Paper]
- Опрос внимания : «Вводной обзор механизмов внимания в проблемах НЛП». Arxiv (2018) [Paper]
- Аддитивное внимание : «Перевод нейронной машины путем совместного обучения для выравнивания и перевода». ICLR (2015) [Paper]
- Мультипликативное внимание : «Эффективные подходы к основанным на внимании перевод нейронной машины». EMNLP (2015) [Paper]
- Сеть памяти : «Сетки с сети памяти». Neurips (2015) [Paper]
- Механизм копирования (PGN) : «Добавьте к делу: суммирование с помощью сетей Gointer-Generator». ACL (2017) [Paper] [Код]
- Механизм копирования : «Включение механизма копирования в обучение последовательности к последовательности». ACL (2016) [Paper]
- Эльмо : «Глубокие контекстуализированные представления слов». NAACL (2018) [Paper] [Код]
- Перчатка : «Перчатка: глобальные векторы для представления слов». Emnlp (2014) [Paper] [Код]
- Учебник Word2VEC : «Объяснение параметров Word2VEC. Arxiv (2016) [Paper]
- Многозадачное обучение : «Обзор многозадачного обучения в глубоких нейронных сетях». Arxiv (2017) [Paper]
- Градиент спуск : «Обзор алгоритмов оптимизации градиентного происхождения». Arxiv (2016) [Paper]
? Вернуться к вершине
Системы диалога
Опрос по диалогу
- Генерация данных : «Опрос о последних достижениях в области генерации разговорных данных». arxiv (2024) [бумага]
- Упреждающий диалог : «Обзор проактивных систем диалога: проблемы, методы и перспективы». Ijcai (2023) [бумага]
- Ответственный диалог : «Недавние достижения в отношении безопасных, ответственных и моральных систем диалога: опрос». arxiv (2023) [бумага]
- Диалог переговоров : «Давайте будем вести переговоры! Обзор систем диалога переговоров». arxiv (2022) [бумага]
- Диалог на основе DL : «Последние достижения в системах диалога на основе глубокого обучения: систематический опрос». arxiv (2021) [бумага]
- Диалог с открытым доменом : «Проблемы в создании интеллектуальных диалоговых систем с открытым доменом». TOIS (2020) [Paper]
- Системы диалога : «Опрос о системах диалога: последние достижения и новые границы». Sigkdd Explorations (2017) [Paper]
- Корпуса диалога : «Обзор доступных корпусов для создания систем диалога, управляемых данными». Arxiv (2017) [Paper] [Data]
? Вернуться к вершине
Разговорные LLMS
- Попугай : «Попугай: улучшение моделей чата с несколькими разворотами, научившись задавать вопросы». arxiv (2023) [бумага]
- Memochat : «Memochat: Tuning LLMS для использования памяти для последовательного разговора с открытым доменом на дальние действия». arxiv (2023) [бумага]
- Llama 2-chat : «Llama 2: Open Foundation и тонкие модели чата». Meta (2023) [Paper] [Код]
- Чатглм3 : «Чатглм3 серия: открытый двуязычный чат LLMS». Цинхуа (2023) [Код]
- Чатглм2-6B : «Чатглм2-6B: открытый двуязычный чат LLM». Цинхуа (2023) [Код]
- MPC : «побудил LLMS в качестве модулей чат-бота для длительного разговора с открытым доменом». ACL-сайты (2023) [Paper] [Code]
- MemoryBank-SiliconFriend : «Bement Bank: улучшение больших языковых моделей с долговременной памятью». arxiv (2023) [Paper] [Код]
- Ultrachat : «Улучшение языковых моделей чата за счет масштабирования высококачественных учебных разговоров». arxiv (2023) [Paper] [Data]
- Chatalpaca : «Chatalpaca: многократный диалог, основанный на инструкциях Alpaca». GitHub (2023) [Данные]
- Феникс : «Феникс: демократизация ЧАТГПТ на языках». arxiv (2023) [Paper] [Код]
- Долли : «Бесплатная Долли: представление первого в мире по-настоящему открытого обучения LLM». DataBricks (2023) [Код]
- Baize : «Baize: модель чата с открытым исходным кодом с параметрами настройки на данные самостоятельной работы». arxiv (2023) [Paper] [Код]
- Vicuna : «Vicuna: чат-бот с открытым исходным кодом, впечатляющий GPT-4 с качеством 90% CHATGPT». Lmsys org (2023) [Блог] [Код]
- Коала : «Коала: модель диалога для академических исследований». UC Berkeley (2023) [Блог] [Код]
- Белль : «Белль: Будь всеми большим языковым модельным двигателем». Lianjiatech (2023) [Код]
- Альпака : «Альпака: сильная, воспроизводимая модель, связанная с инструкциями». Стэнфорд (2023) [Блог] [Код] [Alpaca-Lora]
- Чатглм-6B : «Открытая двуязычная языковая модель диалога». Цинхуа (2023) [Код]
- Открытый помощник : «Открытый помощник: разговорной ИИ для всех». GitHub (2023) [Project] [Code]
- CHATGPT : «CHATGPT: оптимизация языковых моделей для диалога». Openai (2022) [Блог]
- Воробей : «Улучшение выравнивания диалоговых агентов с помощью целевых человеческих суждений». arxiv (2022) [Paper] [Data]
- Blenderbot3 : «Blenderbot 3: развернутый разговорной агент, который постоянно учится ответственному вовлечению». arxiv (2022) [бумага]
- Ламда : «Ламда: Языковые модели для диалоговых приложений». arxiv (2022) [бумага]
- Годель : «Годель: крупномасштабное предварительное обучение для целенаправленного диалога». arxiv (2022) [Paper] [Код]
- Антропный помощник V2 : «Обучение полезному и безвредному помощнику для подкрепления, обучения от обратной связи человека». arxiv (2022) [бумага]
- Антропический помощник : «Общий помощник по языку в качестве лаборатории для выравнивания». arxiv (2021) [бумага]
? Вернуться к вершине
Мультимодальный диалог
Расположенный и воплощенный диалог
- SLL : «Ситуационные диалоги на основе больших языков для изучения второго языка». arxiv (2024) [бумага]
- Embel Plan : «Предсказание мультимодального воплощенного плана, дополненное синтетическим воплощенным диалогом». EMNLP (2023) [бумага]
- WTAG : «Могут ли фонд модели наблюдать, говорить и направлять вас шаг за шагом, чтобы сделать торт?». EMNLP-итоги (2023) [Paper] [Код]
- SIMMC-VR : «SIMMC-VR: ориентированный на задачу набор мультимодального диалога с расположенными и захватывающими потоками VR». ACL (2023) [бумага]
- Конечно : «Диалог мультимодальной рекомендации с субъективным предпочтением: новый вызов и эталон». ACL (2023) [Paper] [Данные]
- Сахар : «текстовый набор данных для выбора упреждающего ответа». ACL (2023) [Paper] [Данные]
- Minddial : «Minddial: Dynamics Dynamics отслеживание с моделированием теории для построения для определения генерации нейронных диалогов». arxiv (2023) [бумага]
- Холаассист : «Холаассист: эгоцентрический набор данных человеческого взаимодействия для интерактивных помощников искусственного интеллекта в реальном мире». ICCV (2023) [Paper] [Data]
- Коллаб : «На пути к совместному плану приобретению плана через теорию моделирования ума в расположенном диалоге». Ijcai (2023) [Paper] [Код]
- Alexa Arena : «Alexa Arena: пользовательская интерактивная платформа для воплощенного ИИ». arxiv (2023) [Paper] [Код]
- Seagull : «Seagull: воплощенный агент для инструкции, следующий через расположенный диалог». Alexa Prize Simbot Challenge (2023) [Paper]
- SITCOM-DETR : «Какой из них вы имеете в виду? MultiModal Identification в диалоге в расположении». EALL-SRW (2023) [Paper] [Код]
- MLR : «Улучшение расположенных разговорных агентов с пошаговыми мультимодальными логическими рассуждениями». DSTC11 (2023) [Paper]
- Simplemtod : «SimpleMtod: простая языковая модель для мультимодального диалога, ориентированного на задачи с символическим представлением сцены». arxiv (2023) [бумага]
- Весна : «Весна: расположенный агент для разговора, предварительно проведенный с мультимодальными вопросами с графика инкрементного макета». AAAI (2023) [Paper] [Код]
- Дороти : «Дороти: разговорный диалог для обращения неожиданных ситуаций в интерактивных автономных агентах вождения». Emnlp-поступки (2022) [Paper] [Code]
- Световой курс : «Расположенный диалог, обучение через процедурную среду генерации среды». ACL (2022) [бумага]
- Данли : «Данли: совещательный агент для следования инструкциям по естественному языку». EMNLP (2022) [Paper] [Код]
- PRS : «Обучение опосредованию различий в прагматическом общении». ACL (2022) [Paper] [Код]
- Совместная модель : «Обучение в встраивание мультимодальных контекстов для расположенных разговорных агентов». NAACL-поступки (2022) [Paper] [Код]
- Teach_film : «Не копируйте учителя: данные и модельные задачи в воплощенном диалоге». EMNLP (2022) [Paper] [Код]
- Учить : «Учить: воплощенные в задачах агенты, которые общаются». Aaai (2022) [Paper] [Data]
- Mindcraft : «Mindcraft: Теория моделирования ума для расположенного диалога в совместных задачах». EMNLP (2021) [Paper] [Код]
- Мультимодальная модель : «Мультимодальные взаимодействия с использованием предварительно проведенных унимодальных моделей для SIMMC 2.0». DSTC10 (2022) [Paper] [Код]
- SIMMC 2.0 : «SIMMC 2.0: Набор данных диалога, ориентированного на задачу для иммерсивных мультимодальных разговоров» EMNLP (2021) [Paper] [Код]
- MM-DST : «Многозадачное обучение для расположенных многодоменных сквозных систем диалога». arxiv (2021) [бумага]
- SIMMC : «Расположенный и интерактивные мультимодальные разговоры». Colg (2020) [Paper] [Код]
- Minecraft-BAP : «Учимся выполнять инструкции в диалоге Minecraft». ACL (2020) [Paper] [Код]
- CREALBAR : «Выполнение инструкций в расположенных совместных взаимодействиях». Emnlp (2019) [Paper] [Код]
- Диалог Minecraft : «Совместный диалог в Minecraft». ACL (2019) [Paper] [Код]
- CLG : «Совместный язык, основанный на расположенном диалоге человека -робот». Журнал AI (2016) [Paper]
- SHRD : «Вернемся к миру блоков: изучение новых действий через расположенный диалог человека-робот». Sigdial (2014) [Paper]
Визуально обоснованный диалог
- Тигр : «Тигр: единая генеративная модельная структура для генерации реакций мультимодального диалога». Колгинг (2024). [Paper] [Код]
- Dialogcc : «Dialogcc: автоматический конвейер для создания высококачественного многомодального набора данных диалога». NAACL (2024) [Paper] [DATA]
- VLAW-MDM : «Структура для задач разминки на языке зрения в моделях мультимодальных диалогов». EMNLP (2023) [Paper] [Код]
- ZRIGF : «ZRIGF: инновационная мультимодальная структура для генерации диалога с нулевым ресурсом». ACM MM (2023) [Paper] [Код]
- Vdialogue : «Vdialogue: единый эталон оценки для визуального диалога». arxiv (2023) [бумага]
- TextBind : «TextBind: многоворотливая мельчайшая мультимодальная инструкция в дикой природе». arxiv (2023) [Paper] [Data]
- VSTAR : «VSTAR: набор данных диалога, расположенный на видео, для расположенного семантического понимания с сценой и темами переходов». ACL (2023) [Paper] [Данные]
- COMSET : «Генерация комических диалогов на основе мультимодальной личности». ACL (2023) [Paper] [Код]
- Mpchat : «Mpchat: к мультимодальному разговору о персонаже». ACL (2023) [Paper] [Код]
- Темп : «Темп: единый мультимодальный диалог перед тренировками с прогрессивными и композиционными экспертами». ACL (2023) [Paper] [Код]
- Mmdialog : «Mmdialog: крупномасштабный набор данных с несколькими разворотами для мультимодального разговора с открытым доменом». ACL (2023) [Paper] [Данные]
- MDS-S2 : «Двойные семантические знания, составленные с мультимодальными диалогами». Сигир (2023) [бумага]
- Tiktalk : «Tiktalk: многомодальный набор данных диалога для реального мира». arxiv (2023) [Paper] [Код]
- Шампанское : «Шампанское: изучение реальных разговоров из крупномасштабных веб-видео». arxiv (2023) [Paper] [Код]
- MMCHAT : «MMCHAT: многомодальный набор данных чата в социальных сетях». Lrec (2022) [Paper] [Код]
- CRVD : «Совместные рассуждения о мультимодальных семантических графиках для генерации видеологов». EMNLP-итоги (2022) [бумага]
- M3ED : «M3ED: мультимодальная мульти-сцену многоупомянутая эмоциональная база данных диалога». ACL (2022) [Paper] [Данные]
- MDRG : «Генерация реакции мультимодального диалога». ACL (2022) [бумага]
- Unitranser : «Unitranser: объединенная структура семантического представления трансформатора для мультимодальной задачи, ориентированной на задачу системы». ACL (2022) [бумага]
- PhotoChat : «PhotoChat: набор данных диалога человека с человеком с поведением обмена фотографиями для совместного моделирования текста изображений». ACL (2021) [Paper] [Данные]
- Многомодальный диалог : «Построение многомодального набора данных диалога путем замены текста семантически релевантными изображениями». ACL (2021) [Paper] [Код]
- OpenVidial 2.0 : «OpenVidial 2.0: более масштабный набор данных генерации диалога с открытым доменом с визуальным контекстом». arxiv (2021) [Paper] [Data]
- Сокровище : «Мультимодальная диалоговая система: понимание вопросов на основе реляционного графика». ACM MM (2021) [Paper] [Код]
- MMConv : «MMConv: среда для мультимодального разговорного поиска в нескольких доменах». Sigir (2021) [Paper] [Data]
- Изображение чат : «Изображение чат: задействованные разговоры». ACL (2020) [Paper] [Данные]
- MTN : «Мультимодальные трансформаторные сети для сквозных систем диалога». ACL (2019) [Paper] [Код]
- MELD : «MELD: мультимодальный многопартийный набор данных для распознавания эмоций в разговорах». ACL (2019) [Paper] [Data]
- Clevr-Dialog : «Clevr-Dialog: диагностический набор данных для многоуровневых рассуждений в визуальном диалоге». NAACL (2019) [Paper] [Данные]
- Visdial-RL : «Улучшение генеративного визуального диалога, отвечая на разнообразные вопросы». Emnlp (2019) [Paper] [Код]
- Магия : «Мультимодальная диалоговая система: генерирование ответов через адаптивные декодеры». ACM MM (2019) [Paper] [Код]
- KMD : «Многомодальные диаловые системы с знаниями». ACM MM (2018) [Paper]
- MMD : «На пути построения крупномасштабных мультимодальных систем беседы». AAAI (2018) [Paper] [Данные]
- Поговорите на прогулке : «Поговорите по прогулке: навигация в Нью -Йорке через заземленный диалог». Arxiv (2018) [Paper] [Код]
- IGC : «Разрешенные разговоры: мультимодальный контекст для естественного генерации вопросов и ответов». Ijcnlp (2017) [Paper] [Data]
- Висдиал : «Визуальный диалог». CVPR (2017) [Paper] [Data]
? Вернуться к вершине
Упреждающий диалог
Разное проактивного диалога
- DPDP : «Планирование как человек: двойная структура для планирования диалога». ACL (2024) [Paper] [Код]
- PCA : «На пути к человеческому проактивным разговорным агентам». Сигир (2024) [бумага]
- Procot : «Подсказка и оценка больших языковых моделей для проактивных диалогов: разъяснение, целевые и непоколные номера». EMNLP-итоги (2023) [Paper] [Код]
- Учебное пособие : «Осведомленность о целях для разговорного ИИ: Проактивность, неколлаборативность и за его пределами». ACL (2023) [бумага]
Целевой диалог
- PAI : «На пути к целеустремленным интеллектуальным системам репетиторства в онлайн-образовании». arxiv (2023) [бумага]
- Topdial : «Проактивные системы проактивного диалога с персонализацией: разработка задач и курирование набора данных». EMNLP (2023) [Paper] [Код]
- RTCP : «Усиленное целевое разговорное продвижение». EMNLP (2023) [Paper] [Код]
- MTGP : «MTGP: многократный диалог, ориентированный на генеративный глобальный путь с гибкими поворотами». ACL-сайты (2023) [Paper] [Code]
- Цвет : «Планирование диалога с помощью стохастического процесса Brownian Bridge для целенаправленного проактивного диалога». ACL-сайты (2023) [Paper] [Code]
- Topkg : «Topkg: целевой ориентированный диалог посредством глобального планирования на графике знаний». Coling (2022) [Paper] [Код]
- TGCP : «Планирование разговора с открытым доменом, направленным на цель». Coling (2022) [Paper] [Код]
- FOP : «Долгосрочный контроль для генерации диалога: методы и оценка». NAACL (2022) [Paper] [Код]
- CODA : «Генерация реакции диалога с целевым диалогом с использованием здравого смысла и увеличения данных». NAACL-поступки (2022) [Paper] [Код]
- Выдры : «Выдры: переходы на темы на один развод для диалога с открытым доменом». ACL (2021) [Paper] [Данные]
- CG-NAR : «Ясно, что ясно, разговоры: быстро: неавторегрессивное поколение под управлением концепции для систем диалога с открытым доменом». EMNLP (2021) [Paper] [Код]
- DUCONV : «Проактивный разговор о человеке с явными целями разговора». ACL (2019) [Paper] [Код]
- CKC : «Нейронная разговорная модель под руководством ключевых слов». AAAI (2021) [Paper] [Код]
- Knowhrl : «График знаний, основанный на планировании целей для поколения разговоров с открытым доменом». Aaai (2020) [бумага]
- DKRN : «Динамическая сеть маршрутизации знаний для разговора с открытым доменом». AAAI (2020) [Paper] [Код]
- TGConv : «Разговор с открытым доменом, направленным на цель». ACL (2019) [Paper] [Код]
Необоялчный диалог (убеждение и переговоры)
- Поездка : «Сила заключается в различиях! На пути к эффективным неколлабаративным диалогам посредством индивидуального планирования стратегии». arxiv (2024) [бумага]
- INA : «INA: интегративный подход к улучшению стратегий переговоров с помощью системы диалога на основе вознаграждений». EMNLP (2023) [Paper] [Data]
- I-Pro : «Взаимодействие с не-кооперативным пользователем: новая парадигма для политики проактивного диалога». Сигир (2022) [бумага]
- Паад : «На пути к продвижению автономного диалогового агента». NAACL (2022) [Paper] [Код]
- Persrfi : «Уточнить и подражать: сокращение повторения и несоответствия в диалогах убеждения посредством обучения подкреплению и человеческой демонстрации». Emnlp-поступки (2021) [Paper] [Code]
- Подержка : «Подержка: вычислительное моделирование стратегий сопротивления в убедительных разговорах». EACL (2021) [Paper] [Код]
- ARDM : «Чередующая модель диалога повторяется с крупномасштабными предварительно обученными языковыми моделями». EACL (2021) [Paper] [Код]
- Диаграмма : «Диаграмма: включение интерпретируемых сети стратегических графов в диалоги по переговорам». ICLR (2021) [Paper] [Код]
- Переговоры : «Улучшение диалоговых систем для переговоров с моделированием личности». ACL (2021) [Paper] [Код]
- Фехед : «Увеличение неколлабаративных диалоговых систем с явной семантической и стратегической историей диалогов». ICLR (2020) [Paper] [Код]
- CTX-PSA : «Обучение планировать и реализовать отдельно для открытых систем диалога». Emnlp-поступки (2020) [Paper] [Code]
- Переговоры : «Тренер динамической стратегии для эффективных переговоров». Sigdial (2019) [Paper] [Код]
- Убеждение Persuasyforgood : «Убеждение навсегда: к персонализированной убедительной системе диалога для социального блага». ACL (2019) [Paper] [Data]
- Craigslistbargain : «Стратегия развязки и генерация в диалогах переговоров». Emnlp (2018) [Paper] [Data]
? Вернуться к вершине
Персонализированный диалог
Основанный на персонажах диалог
- LLM-Werewolf : «Изучение больших языковых моделей для общения: эмпирическое исследование оборотня». arxiv (2023) [бумага]
- Чатхарухи : «Чатхарухи: возрождение аниме -персонажа в реальности с помощью большой языковой модели». arxiv (2023) [Отчет] [Код]
- DPCD : «Привет, Шелдон! Создание глубоких персонализированных персонажей из телешоу». arxiv (2023) [Paper] [Data]
- Корнелл-богатый : «Персонализированное языковое моделирование персонажей экрана с использованием богатых аннотаций метаданных». arxiv (2023) [Paper] [Data]
- Глюп : «Онтологически верное поколение диалогов не игровых персонажей». Arxic (2022) [Paper]
- HPD : «Модели с большими языками встречаются с Гарри Поттером: двуязычный набор данных для согласования диалоговых агентов с персонажами». arxiv (2022) [Paper] [Data]
- Dialstory : «Проценка для понимания и генерации диалога между персонажами в историях». arxiv (2022) [бумага]
- Carecall : «Строительство роли указанной системы диалога с открытым доменом, использующей крупномасштабные языковые модели». NAACL (2022) [Paper] [Данные]
- PDP : «Познакомьтесь с вашим любимым персонажем: чат-бот с открытым доменом, имитирующие вымышленных персонажей только с несколькими высказываниями». NAACL (2022) [Paper] [Код]
- RPA : «Я или вы? Современные модели диалога не могут поддерживать идентичность». Naacl-findings (2022) [бумага]
- Характер : «Характерчат: поддержка создания вымышленных персонажей посредством разговора и прогрессивного проявления с чат -ботом». ACM C & C (2021) [Paper]
- Алоха : «Алоха: искусственное изучение человеческих атрибутов для диалоговых агентов». AAAI (2020) [Paper] [Код]
- Свет : «Учимся говорить и действовать в фантастической текстовой приключенческой игре». Emnlp (2019) [Paper] [Data]
Диалог с личности
- UBPL : «Построение личностных качеств в больших языковых моделях с помощью неконтролируемых персонализированных лексиков». arxiv (2023) [бумага]
- Характер : «Характер: обучение для разговорного ИИ с персонализированной социальной поддержкой». arxiv (2023) [Paper] [Код]
- Chatgpt-Mbti : «Может ли CHATGPT оценить человеческих личностей? Общая структура оценки». arxiv (2023) [Paper] [Код]
- Побуждая личность : «Контроль стиля личности в диалоге с нулевым выстрелом на основе быстрого обучения». IWSDS (2023) [бумага]
- CPED : «CPED: крупномасштабный китайский персональный и эмоциональный набор диалога для разговорного ИИ». arxiv (2022) [Paper] [Data]
- Пельд : «Автоматически выбирайте эмоции для ответа с помощью перехода эмоций, затронутых личностью». ACL-сайты (2021) [Paper] [Data]
- Friendspersona : «Автоматическое распознавание личности на основе текста на монологах и многопартийных диалогах с использованием внимательных сетей и контекстуальных встроений». AAAI-Student Abstract (2020) [Paper] [Данные]
- APR : «Идентификация личностных черт с использованием динамики перекрытия в многопартийном диалоге». Interspeech (2019) [Paper]
- PersonalDilaog : «Персонализированное поколение диалога с диверсифицированными чертами». Arxiv (2019) [Paper] [Data]
- PersonAgenlg : «Контролируя стилистические вариации, основанные на личности, с нейронными генераторами естественного языка». Sigdial (2018) [Paper] [Data]
Основанный на личности диалог
- Comperdial : «Comperdial: Commonsense Persona-Greated Dialogue Dataet и Clackmark». arxiv (2024) [бумага]
- IDL : «« В диалогах, которые мы изучаем »: к персонализированному диалогу без предварительно определенных профилей через обучение в диалоге». arxiv (2024) [бумага]
- Dialogicl : «Создание хорошего быстрого или предоставления образцовых диалогов? Изучение встроенного обучения для генерации диалогов на основе личности». arxiv (2024) [бумага]
- Varmi : «Создание последовательных диалоговых агентов с персонажем с офлайн -обучением подкрепления». EMNLP (2023) [Paper] [Код]
- Опела : «Когда толпа встречает персону: создание крупномасштабного диалога открытого домена. arxiv (2023) [Paper] [Data]
- Orig : «На пути к надежному персонализированному генерации диалога с помощью нечувствительной к заказу регуляризации представления». ACL-сайты (2023) [Paper] [Code]
- CLV : «Улучшение персонализированного поколения диалога с контрастными скрытыми переменными: сочетание разреженной и плотной личности». ACL (2023) [Paper] [Код]
- SIMOAP : «Simoap: улучшить когерентность и последовательность в генерации диалогов на основе личности посредством перепродажи и пост-оценки». ACL (2023) [Paper] [Код]
- LMEDR : «Обучение запоминаниям въезда и дискурсивных отношений для личностных диалогов». AAAI (2023) [Paper] [Код]
- Поиск для получения : «Улучшение последовательности личности в разговоре от Persona расширяется». CIKM (2022) [Paper] [Код]
- Неявная-персонала : «Персонализированный генератор диалога с неявным обнаружением личности пользователей». Colging (2022) [Paper]
- CareCallMemory : «Держите меня в курсе! Управление памятью в долговременных разговорах». Emnlp-поступки (2022) [Paper] [Data]
- PersonAdeFense : «Вы не знаете мой любимый цвет: предотвращение представлений диалога от раскрытия личных ораторов». NAACL (2022) [Paper] [Код]
- Настройка быстрого настройки : «Создание персонализированной системы диалога с быстрой настройкой». NAACL-SRW (2022) [бумага]
- Dulemon : «Давно не видите! Разговор с открытым доменом с долгосрочной персоной памятью». ACL-сайты (2022) [Paper] [Data]
- Информация : «Вы действительно понимаете, что мне нужно: интеллектуальные и дружелюбные агенты диалога, обосновывая знания и персону». Emnlp-поступки (2022) [Paper] [Code]
- Фокус : «Позвоните для индивидуального разговора: индивидуальное разговор, обоснование личности и знания». AAAI (2022) [Paper] [Код]
- MSP : «Меньше больше: научиться уточнить историю диалога для индивидуального поколения диалога». NAACL (2022) [бумага]
- GME : «Передачаемые личные диалоги посредством заземленных минимальных изменений». EMNLP (2021) [Paper] [Код]
- Боб : «Боб: Берт над Бертом для обучения моделей диалогов на основе личности из ограниченных персонализированных данных». ACL (2021) [Paper] [Код]
- Пабст : «Неконтролируемое обогащение диалогового окна, посвященного персонажу с фоновыми историями». ACL (2021) [Paper] [Код]
- DHAP : «Один чат -бот на человека: создание персонализированных чат -ботов на основе неявных профилей пользователей». Сигир (2021) [бумага]
- PCHATBOT : «PCHATBOT: крупномасштабный набор данных для персонализированного чата». Sigir (2021) [Paper] [Data]
- Компак : «Как пешие прогулки? Вы, вероятно, наслаждаетесь природой: приземленный диалог с персонажем с расширением здравого смысла». EMNLP (2020) [Paper] [Код]
- Прагматическое согласованность : «Я буду звучать как я? Повышение последовательности личности в диалогах с помощью прагматического самосознания». EMNLP (2020) [Paper] [Код]
- Xpersona : «Xpersona: оценка многоязычного персонализированного чата». arxiv (2020) [Paper] [Данные]
- KVPI : «Идентификация согласованности профиля для агентов диалога с открытым доменом». EMNLP (2020) [Paper] [Код]
- GDR : «Сгенерировать, удалить и переписать: трехступенчатая структура для улучшения последовательности личности генерации диалога». ACL (2020) [бумага]
- P^2bot : «Вы впечатляете меня: поколение диалога через взаимное восприятие персоны». ACL (2020) [Paper] [Код]
- RCDG : «генерирование последовательных диалогов, использующих вывод естественного языка». AAAI (2020) [Paper] [Код]
- Persona-Sparse : «Персонализированная модель генерации диалога с данными Persona-Sparse, основанной на предварительном обучении». Aaai (2020) [бумага]
- Personawae : «Персонализация моделирования в непрерывном пространстве для генерации ответов через Augmented Wasserstein Autoencoders». EMNLP (2019) [Paper]
- PAML : «Персонализирующие диалог-агенты с помощью мета-обучения». ACL (2019) [Paper] [Код]
- Personachat : «Персонализирующие диалог: у меня есть собака, у вас тоже есть домашние животные?» ACL (2018) [Paper] [Данные]
- PCCM : «Присвоение личности/профиля на машину чата для последовательного поколения разговоров». IJCAI (2018) [Paper]
? Вернуться к вершине
Эмоциональный диалог
Эмоциональная поддержка диалога
- Предупреждение о предпочтениях : «Могут ли крупные языковые модели быть хорошим эмоциональным сторонником? Смягчение предвзятости предпочтений при разговоре эмоциональной поддержки». ACL (2024) [Paper]
- Escot : «Escot: к интерпретируемой эмоциональной поддержке систем диалога». ACL (2024) [Paper] [Код]
- Маффин : «Маффин: смягчение бесполезности в эмоциональной поддержке беседы с многогранными обратной связью с ИИ». ACL-сайты (2024) [Paper] [Code]
- DDRCU : «Динамическое демонстрационное поиск и когнитивное понимание для эмоциональной поддержки разговора». Sigir (2024) [Paper] [Код]
- Кеми : «Объединенная знаниями смешанная система диалога для эмоциональной поддержки разговоров». ACL (2023) [Paper] [Код]
- CSCONV : «Система диалога когнитивной стимуляции с слиянием знаний с несколькими источниками для старейшин с когнитивными нарушениями». ACL (2023) [Paper] [Код]
- AUGESC : «Augesc: увеличение диалога с большими языковыми моделями для эмоциональной поддержки разговора». ACL-сайты (2023) [бумага]
- Transesc : «Transesc: сглаживание разговора эмоциональной поддержки с помощью перехода по состоянию на уровне поворота». ACL-сайты (2023) [Paper] [Code]
- PAL : «PAL: Персоночная эмоциональная поддержка генерации разговоров». ACL-сайты (2023) [Paper] [Code]
- Multiesc : «Улучшение многообразования эмоциональной поддержки генерации диалога с планированием стратегии Lookahead». EMNLP (2022) [Paper] [Код]
- Разное : «Разное: смешанная стратегическая модель, интегрирующая комету для эмоциональной поддержки разговора». ACL (2022) [Paper] [Код]
- C3KG : «C3KG: График знаний о разговоре китайского языка». ACL-сайты (2022) [Paper] [Data]
- GLHG : «Контроль во всем мире, понимайте локально: глобальная иерархическая графическая сеть для эмоциональной поддержки». Ijcai (2022) [бумага]
- Esconv : «На пути к диалоговому окно эмоциональной поддержки». ACL (2021) [Paper] [Данные]
Эмпатический диалог
- Stickerconv : «Stickerconv: генерирование мультимодальных эмпатических реакций с нуля». ACL (2024) [Paper] [Данные]
- PERCEPTIVEAGENT : «Поговорите с человеческими агентами: эмпатический диалог с помощью ощутимого акустического приема и реакции». ACL (2024) [Paper] [Код]
- Электронный ядер : «Электронный ядер: эмоциональная корреляция усилила эмпатическую генерацию диалога» EMNLP (2023) [Paper]
- EMPSOA : «Не теряйте себя! Сочувствующая генерация ответов через явное осознание самооценки». ACL-сайты (2023) [Paper] [Code]
- Случай : «Случай: выравнивание грубого познания и привязанности к эмпатической генерации ответов». ACL (2023) [Paper] [Код]
- Уход : «Уход: причинность рассуждения о эмпатических ответах посредством условного генерации графиков». Emnlp-поступки (2022) [Paper] [Code]
- EMPGPT-3 : «GPT-3 генерирует эмпатические диалоги? Новый метод выбора примеров в контексте и автоматическая метрика оценки для эмпатического генерации диалога». Coling (2022) [Paper] [Код]
- Позимодиал : «На пути к мультизмущным эмпатическим диалогам с позитивным выявлением эмоций». arxiv (2022) [бумага]
- CEM : «CEM: сочувствие к сочувствующему поколению». AAAI (2022) [Paper] [Код]
- Джи : «Перспектива и прагматика для генерации эмпатических реакций, сосредоточенных на эмоциях». EMNLP (2021) [Paper] [Код]
- Recec : «Улучшение эмпатического поколения реакции путем признания эмоций в разговорах». Emnlp-поступки (2021) [Paper] [Code]
- Comae : «Comae: многофакторная иерархическая структура для эмпатической генерации ответов». ACL-сайты (2021) [Paper] [Code]
- Уход : «Забота: генерация эмоциональной реакции с благоустройством со здравым смыслом с скрытыми понятиями». AAAI (2021) [Paper] [Код]
- EMPDG : «EMPDG: Генерация интерактивных эмпатических диалогов с несколькими разрешениями». Colg (2020) [Paper] [Код]
- Mime : «Mime: имитируя эмоции для сочувственного поколения». EMNLP (2020) [Paper] [Код]
- PEC : «На пути к личности эмпатических разговорных моделей». EMNLP (2020) [Paper] [Код]
- Моэль : «Моэль: смесь чутких слушателей». Emnlp (2019) [Paper] [Код]
- MempetiticDialogues : «На пути к эмпатическим моделям разговоров с открытым доменом: новый эталон и набор данных». ACL (2019) [Paper] [Data]
- EMODS : «генерирование ответов с определенной эмоцией в диалоге». ACL (2019) [Paper]
- Mojitalk : «Mojitalk: генерирование эмоциональных реакций в масштабе». ACL (2018) [Paper]
- ECM : «Эмоциональная чат -машина: эмоциональная генерация разговоров с внутренней и внешней памятью». AAAI (2018) [Paper] [Код]
? Вернуться к вершине
Рекомендационный диалог и CRS
- TCP-Dial : «Следуй за мной: Планирование разговоров для целевых рекомендационных систем диалога». arxiv (2022) [Paper] [Код]
- KERS : «Керс: платформа для диалоговых систем для рекомендаций с несколькими субголами». Emnlp-поступки (2021) [Paper] [Code]
- Durecdial2.0 : «Durecdial 2.0: двуязычный параллельный корпус для разговорной рекомендации». EMNLP (2021) [Paper] [Код]
- Durecdial : «На пути к разговорной рекомендации по сравнению с множественными диалогами». ACL (2020) [Paper] [Код]
- TG-RELIAL : «На пути к системе рекомендаций по разговору, управляемой темами». Colg (2020) [Paper] [Код]
- Вдохновленный : «Вдохновленный: к системам общинных рекомендаций». EMNLP (2020) [Paper] [DATA]
- GoRecdial : «Рекомендация как коммуникационная игра: самоотверженная ботская игра для целенаправленного диалога». Emnlp (2019) [Paper] [Код]
- CRS-Survey : «Обзор разговорных систем рекомендаций». Вычисления ACM (2021) [бумага]
- CRS-Survey : «Достижения и проблемы в разговорных системах рекомендации: опрос». arxiv (2021) [бумага]
- CRSLAB : «CRSLAB: инструментарий с открытым исходным кодом для построения системы рекомендаций по разговору». arxiv (2021) [Paper] [Код]
- MESE : «Улучшение качества систем разговорных рекомендаций» с помощью контекстной мета-информации. NAACL (2022) [Paper] [Код]
- C2-CRS : «C2-CRS: грубое контрастное обучение для системы рекомендации по разговору». WSDM (2022) [Paper] [Код]
- BotPlay : "Self-Supervised Bot Play for Conversational Recommendation with Justifications". arXiv(2021) [paper]
- RID : "Finetuning Large-Scale Pre-trained Language Models for Conversational Recommendation with Knowledge Graph". arXiv(2021) [paper] [code]
- CRFR : "CRFR: Improving Conversational Recommender Systems via Flexible Fragments Reasoning on Knowledge Graphs". EMNLP(2021) [paper]
- NTRD : "Learning Neural Templates for Recommender Dialogue System". EMNLP(2021) [paper] [code]
- CR-Walker : "CR-Walker: Tree-Structured Graph Reasoning and Dialog Acts for Conversational Recommendation". EMNLP(2021) [paper] [code]
- RevCore : "RevCore: Review-augmented Conversational Recommendation". ACL-Findings(2021) [paper] [code]
- KECRS : "KECRS: Towards Knowledge-Enriched Conversational Recommendation System". arXiv(2021) [paper]
- FPAN : "Adapting User Preference to Online Feedback in Multi-round Conversational Recommendation". WSDM(2021) [paper] [code]
- UNICORN : "Unified Conversational Recommendation Policy Learning via Graph-based Reinforcement Learning". SIGIR(2021) [paper] [code]
- KGSF : "Improving Conversational Recommender Systems via Knowledge Graph based Semantic Fusion". KDD(2020) [paper] [code]
- CPR : "Interactive Path Reasoning on Graph for Conversational Recommendation". KDD(2020) [paper] [code]
- EAR : "Estimation-Action-Reflection: Towards Deep Interaction Between Conversational and Recommender Systems". WSDM(2020) [paper] [code]
- KBRD : "Towards Knowledge-Based Recommender Dialog System". EMNLP(2019) [paper] [code]
- ReDial : "Towards Deep Conversational Recommendations". NeurIPS(2018) [paper] [data]
? Back to Top
Knowledge-grounded Dialogue
- DOCTOR : "Dialogue Chain-of-Thought Distillation for Commonsense-aware Conversational Agents". EMNLP(2023) [paper] [code] [demo]
- GATE : "Well Begun is Half Done: Generator-agnostic Knowledge Pre-Selection for Knowledge-Grounded Dialogue". EMNLP(2023) [paper] [code]
- CONNER : "Beyond Factuality: A Comprehensive Evaluation of Large Language Models as Knowledge Generators". EMNLP(2023) [paper] [code]
- K-DIAL : "Improving Factual Consistency for Knowledge-Grounded Dialogue Systems via Knowledge Enhancement and Alignment". EMNLP-Findings(2023) [paper]
- GLM-Dialog : "GLM-Dialog: Noise-tolerant Pre-training for Knowledge-grounded Dialogue Generation". arXiv(2023) [paper] [code]
- RHO : "RHO (ρ): Reducing Hallucination in Open-domain Dialogues with Knowledge Grounding". ACL-Findings(2023) [paper] [code]
- MultiRefKGC : "There Is No Standard Answer: Knowledge-Grounded Dialogue Generation with Adversarial Activated Multi-Reference Learning". EMNLP(2022) [paper] [code]
- CorefDiffs : "CorefDiffs: Co-referential and Differential Knowledge Flow in Document Grounded Conversations". COLING(2022) [paper] [code]
- DTR : "Stylized Knowledge-Grounded Dialogue Generation via Disentangled Template Rewriting". NAACL(2022) [paper] [code]
- XDAI : "XDAI: A Tuning-free Framework for Exploiting Pre-trained Language Models in Knowledge Grounded Dialogue Generation". KDD(2022) [paper] [code]
- PersonaKGC : "There Are a Thousand Hamlets in a Thousand People's Eyes: Enhancing Knowledge-grounded Dialogue with Personal Memory". ACL(2022) [paper] [code]
- KI : "Lexical Knowledge Internalization for Neural Dialog Generation". ACL(2022) [paper] [code]
- DiffKG : "Towards Large-Scale Interpretable Knowledge Graph Reasoning for Dialogue Systems". ACL-Findings(2022) [paper] [code]
- KSAM : "KSAM: Infusing Multi-Source Knowledge into Dialogue Generation via Knowledge Source Aware Multi-Head Decoding". ACL-Findings(2022) [paper]
- MDSP : "Multi-Stage Prompting for Knowledgeable Dialogue Generation". ACL-Findings(2022) [paper] [code]
- FSB : "Few-Shot Bot: Prompt-Based Learning for Dialogue Systems". arXiv(2021) [paper] [code]
- P-GDG : "Exploring Prompt-based Few-shot Learning for Grounded Dialog Generation". arXiv(2021) [paper]
- KAT-TSLF : "A Three-Stage Learning Framework for Low-Resource Knowledge-Grounded Dialogue Generation". EMNLP(2021) [paper] [code]
- DIALKI : "DIALKI: Knowledge Identification in Conversational Systems through Dialogue-Document Contextualization". EMNLP(2021) [paper] [code]
- CoLV : "CoLV: A Collaborative Latent Variable Model for Knowledge-Grounded Dialogue Generation". EMNLP(2021) [paper]
- SKT-KG : "Augmenting Knowledge-grounded Conversations with Sequential Knowledge Transition". NAACL(2021) [paper]
- MSKE : "More is Better: Enhancing Open-Domain Dialogue Generation via Multi-Source Heterogeneous Knowledge". EMNLP(2021) [paper] [code]
- EARL : "EARL: Informative Knowledge-Grounded Conversation Generation with Entity-Agnostic Representation Learning". EMNLP(2021) [paper] [code]
- KGD-CF : "Increasing Faithfulness in Knowledge-Grounded Dialogue with Controllable Features". ACL(2021) [paper]
- SECE : "Space Efficient Context Encoding for Non-Task-Oriented Dialogue Generation with Graph Attention Transformer". ACL(2021) [paper] [code]
- MIKe : "Initiative-Aware Self-Supervised Learning for Knowledge-Grounded Conversations". SIGIR(2021) [paper] [code]
- GOKC : "Learning to Copy Coherent Knowledge for Response Generation". AAAI(2021) [paper] [code]
- KnowledGPT : "Knowledge-Grounded Dialogue Generation with Pre-trained Language Models". EMNLP(2020) [paper] [code]
- DiffKS : "Difference-aware Knowledge Selection for Knowledge-grounded Conversation Generation". EMNLP-Findings(2020) [paper] [code]
- DukeNet : "DukeNet: A Dual Knowledge Interaction Network for Knowledge-Grounded Conversation". SIGIR(2020) [paper] [code]
- CCN : "Cross Copy Network for Dialogue Generation". EMNLP(2020) [paper] [code]
- PIPM : "Bridging the Gap between Prior and Posterior Knowledge Selection for Knowledge-Grounded Dialogue Generation". EMNLP(2020) [paper]
- ConceptFlow : "Grounded Conversation Generation as Guided Traverses in Commonsense Knowledge Graphs". ACL(2020) [paper] [code]
- ConKADI : "Diverse and Informative Dialogue Generation with Context-Specific Commonsense Knowledge Awareness". ACL(2020) [paper] [code]
- KIC : "Generating Informative Conversational Response using Recurrent Knowledge-Interaction and Knowledge-Copy". ACL(2020) [paper]
- SKT : "Sequential Latent Knowledge Selection for Knowledge-Grounded Dialogue". ICLR(2020) [paper] [code]
- KdConv : "KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn Knowledge-driven Conversation". ACL(2020) [paper] [data]
- TransDG : "Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering". AAAI(2020) [paper] [code]
- RefNet : "RefNet: A Reference-aware Network for Background Based Conversation". AAAI(2020) [paper] [code]
- GLKS : "Thinking Globally, Acting Locally: Distantly Supervised Global-to-Local Knowledge Selection for Background Based Conversation". AAAI(2020) [paper] [code]
- AKGCM : "Knowledge Aware Conversation Generation with Explainable Reasoning over Augmented Graphs". EMNLP(2019) [paper] [code]
- DyKgChat : "DyKgChat: Benchmarking Dialogue Generation Grounding on Dynamic Knowledge Graphs". EMNLP(2019) [paper] [code]
- OpenDialKG : "OpenDialKG: Explainable Conversational Reasoning with Attention-based Walks over Knowledge Graphs". ACL(2019) [paper] [data]
- WoW : "Wizard of Wikipedia: Knowledge-Powered Conversational agents". ICLR(2019) [paper]
- PostKS : "Learning to Select Knowledge for Response Generation in Dialog Systems". IJCAI(2019) [paper] [code-1] [code-2]
- NKD : "Knowledge Diffusion for Neural Dialogue Generation". ACL(2018) [paper] [data]
- Dual Fusion : "Smarter Response with Proactive Suggestion: A New Generative Neural Conversation Paradigm". IJCAI(2018) [paper]
- CCM : "Commonsense Knowledge Aware Conversation Generation with Graph Attention". IJCAI(2018) [paper] [code-tf] [code-py]
- MTask : "A Knowledge-Grounded Neural Conversation Model". AAAI(2018) [paper]
- GenDS : "Flexible End-to-End Dialogue System for Knowledge Grounded Conversation". arXiv(2017) [paper]
? Back to Top
Task-oriented Dialogue
- P-ToD : "Personalizing Task-oriented Dialog Systems via Zero-shot Generalizable Reward Function". CIKM(2022) [paper]
- Dialogic : "Dialogic: Controllable Dialogue Simulation with In-Context Learning". EMNLP-Findings(2022) [paper] [code]
- KB-Adapter : "Injecting Domain Knowledge in Language Models for Task-Oriented Dialogue Systems". EMNLP(2022) [paper] [code]
- TacoBot : "Bootstrapping a User-Centered Task-Oriented Dialogue System". Proceedings of Alexa Prize TaskBot(2021) [paper]
- USDA : "User Satisfaction Estimation with Sequential Dialogue Act Modeling in Goal-oriented Conversational Systems". WWW(2022) [paper] [code]
- USS : "Simulating User Satisfaction for the Evaluation of Task-oriented Dialogue Systems". SIGIR(2021) [paper] [data]
- NS-Dial : "An Interpretable Neuro-Symbolic Reasoning Framework for Task-Oriented Dialogue Generation". ACL(2022) [paper] [code]
- GALAXY : "GALAXY: A Generative Pre-trained Model for Task-Oriented Dialog with Semi-Supervised Learning and Explicit Policy Injection". AAAI(2022) [paper] [code]
- PPTOD : "Multi-Task Pre-Training for Plug-and-Play Task-Oriented Dialogue System". arXiv(2021) [paper] [code]
- ToDCL : "Continual Learning in Task-Oriented Dialogue Systems". EMNLP(2021) [paper] [code]
- IR-Net : "Intention Reasoning Network for Multi-Domain End-to-end Task-Oriented Dialogue". EMNLP(2021) [paper]
- HyKnow : "HyKnow: End-to-End Task-Oriented Dialog Modeling with Hybrid Knowledge Management". ACL-Findings(2021) [paper] [code]
- DDMN : "Dual Dynamic Memory Network for End-to-End Multi-turn Task-oriented Dialog Systems". COLING(2020) [paper] [code]
- ToD-BERT : "ToD-BERT: Pre-trained Natural Language Understanding for Task-Oriented Dialogues". EMNLP(2020) [paper] [code]
- GraphDialog : "GraphDialog: Integrating Graph Knowledge into End-to-End Task-Oriented Dialogue Systems". EMNLP(2020) [paper] [code]
- MARCO : "Multi-Domain Dialogue Acts and Response Co-Generation". ACL(2020) [paper] [code]
- DF-Net : "Dynamic Fusion Network for Multi-Domain End-to-end Task-Oriented Dialog". ACL(2020) [paper] [code]
- MALA : "MALA: Cross-Domain Dialogue Generation with Action Learning". AAAI(2020) [paper]
- SGD : "Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset". AAAI(2020) [paper] [data]
- CrossWOZ : "CrossWOZ: A Large-Scale Chinese Cross-Domain Task-Oriented Dialogue Dataset". TACL(2020) [paper] [code]
- MultiWOZ : "MultiWOZ - A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling". EMNLP(2018) [paper] [code]
- Neural Task-Oriented Dialogue : "Learning to Memorize in Neural Task-Oriented Dialogue Systems". MPhil Thesis(2019) [paper]
- GLMP : "Global-to-local Memory Pointer Networks for Task-Oriented Dialogue". ICLR(2019) [paper] [code]
- KB Retriever : "Entity-Consistent End-to-end Task-Oriented Dialogue System with KB Retriever". EMNLP(2019) [paper] [data]
- TRADE : "Transferable Multi-Domain State Generator for Task-Oriented Dialogue Systems". ACL(2019) [paper] [code]
- WMM2Seq : "A Working Memory Model for Task-oriented Dialog Response Generation". ACL(2019) [paper]
- Pretrain-Fine-tune : "Training Neural Response Selection for Task-Oriented Dialogue Systems". ACL(2019) [paper] [data]
- Multi-level Mem : "Multi-Level Memory for Task Oriented Dialogs". NAACL(2019) [paper] [code]
- BossNet : "Disentangling Language and Knowledge in Task-Oriented Dialogs ". NAACL(2019) [paper] [code]
- SDN : "Subgoal Discovery for Hierarchical Dialogue Policy Learning". EMNLP(2018) [paper]
- D3Q : "Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning". EMNLP(2018) [paper] [code]
- DDQ : "Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning". ACL(2018) [paper] [code]
- MAD : "Memory-augmented Dialogue Management for Task-oriented Dialogue Systems". TOIS(2018) [paper]
- TSCP : "Sequicity: Simplifying Task-oriented Dialogue Systems with Single Sequence-to-Sequence Architectures". ACL(2018) [paper] [code]
- Mem2Seq : "Mem2Seq: Effectively Incorporating Knowledge Bases into End-to-End Task-Oriented Dialog Systems". ACL(2018) [paper] [code]
- Topic-Seg-Label : "A Weakly Supervised Method for Topic Segmentation and Labeling in Goal-oriented Dialogues via Reinforcement Learning". IJCAI(2018) [paper] [code]
- AliMe : "AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine". ACL(2017) [paper]
- KVR Net : "Key-Value Retrieval Networks for Task-Oriented Dialogue". SIGDIAL(2017) [paper] [data]
? Back to Top
Open-domain Dialogue
Long-term Dialogue
- THEANINE : "THEANINE: Revisiting Memory Management in Long-term Conversations with Timeline-augmented Response Generation". arXiv(2024) [paper]
- LD-Agent : "Hello Again! LLM-powered Personalized Agent for Long-term Dialogue". arXiv(2024) [paper] [code]
- CPD : "Position Debiasing Fine-Tuning for Causal Perception in Long-Term Dialogue". IJCAI(2024) [paper]
- TemporalMemory : "Toward Conversational Agents with Context and Time Sensitive Long-term Memory". arXiv(2024) [paper] [data]
- LoCoMo : "Evaluating Very Long-Term Conversational Memory of LLM Agents". ACL(2024) [paper] [data]
- Conversation Chronicles : "Conversation Chronicles: Towards Diverse Temporal and Relational Dynamics in Multi-Session Conversations". EMNLP(2023) [paper] [data]
- GapChat : "Mind the Gap Between Conversations for Improved Long-Term Dialogue Generation". EMNLP-Findings(2023) [paper] [data]
- UniMC : "UniMC: A Unified Framework for Long-Term Memory Conversation via Relevance Representation Learning". arXiv(2023) [paper]
- RS : "Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models". arXiv(2023) [paper]
- MSC : "Beyond Goldfish Memory: Long-Term Open-Domain Conversation". ACL(2022) [paper] [data]
Response Generation
- Overview : "Open-domain Dialogue Generation: What We Can Do, Cannot Do, And Should Do Next". ACL-NLP4ConvAI(2022) [paper]
- Chirpy Cardinal : "Neural Generation Meets Real People: Building a Social, Informative Open-Domain Dialogue Agent". SIGDIAL(2022) [paper] [code] [project]
- TIL : "Towards Efficient Dialogue Pre-training with Transferable and Interpretable Latent Structure". EMNLP(2022) [paper]
- ProphetChat : "ProphetChat: Enhancing Dialogue Generation with Simulation of Future Conversation". ACL(2022) [paper]
- DialoFlow : "Conversations Are Not Flat: Modeling the Dynamic Information Flow across Dialogue Utterances". ACL(2021) [paper] [code]
- DiSCoL : "DiSCoL: Toward Engaging Dialogue Systems through Conversational Line Guided Response Generation". NAACL(2021) [paper] [code]
- DialogBERT : "DialogBERT: Discourse-Aware Response Generation via Learning to Recover and Rank Utterances". AAAI(2021) [paper]
- BlenderBot : "Recipes for Building an Open-Domain Chatbot". EACL(2021) [paper] [code]
- CDial-GPT : "A Large-Scale Chinese Short-Text Conversation Dataset". NLPCC(2020) [paper] [code]
- DialoGPT : "DialoGPT : Large-Scale Generative Pre-training for Conversational Response Generation". ACL(2020) [paper] [code]
- CG-Policy : "Conversational Graph Grounded Policy Learning for Open-Domain Conversation Generation". ACL(2020) [paper]
- PLATO-XL : "PLATO-XL: Exploring the Large-scale Pre-training of Dialogue Generation". arXiv(2021) [paper] [code]
- PLATO-2 : "PLATO-2: Towards Building an Open-Domain Chatbot via Curriculum Learning". ACL-Findings(2021) [paper] [code]
- PLATO : "PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable". ACL(2020) [paper] [code]
- Guyu : "An Empirical Investigation of Pre-Trained Transformer Language Models for Open-Domain Dialogue Generation". arXiv(2020) [paper] [code]
- CL4Dialogue : "Group-wise Contrastive Learning for Neural Dialogue Generation". EMNLP-Findings(2020) [paper] [code]
- Neg-train : "Negative Training for Neural Dialogue Response Generation". ACL(2020) [paper] [code]
- HDSA : "Semantically Conditioned Dialog Response Generation via Hierarchical Disentangled Self-Attention". ACL(2019) [paper] [code]
- CAS : "Skeleton-to-Response: Dialogue Generation Guided by Retrieval Memory". NAACL(2019) [paper] [code]
- Edit-N-Rerank : "Response Generation by Context-aware Prototype Editing". AAAI(2019) [paper] [code]
- HVMN : "Hierarchical Variational Memory Network for Dialogue Generation". WWW(2018) [paper] [code]
- XiaoIce : "The Design and Implementation of XiaoIce, an Empathetic Social Chatbot". arXiv(2018) [paper]
- D2A : "Dialog-to-Action: Conversational Question Answering Over a Large-Scale Knowledge Base". NeurIPS(2018) [paper] [code]
- DAIM : "Generating Informative and Diverse Conversational Responses via Adversarial Information Maximization". NeurIPS(2018) [paper]
- REASON : "Dialog Generation Using Multi-turn Reasoning Neural Networks". NAACL(2018) [paper]
- STD/HTD : "Learning to Ask Questions in Open-domain Conversational Systems with Typed Decoders". ACL(2018) [paper] [code]
- CSF : "Generating Informative Responses with Controlled Sentence Function". ACL(2018) [paper] [code]
- DAWnet : "Chat More: Deepening and Widening the Chatting Topic via A Deep Model". SIGIR(2018) [paper] [code]
- ZSDG : "Zero-Shot Dialog Generation with Cross-Domain Latent Actions". SIGDIAL(2018) [paper] [code]
- DUA : "Modeling Multi-turn Conversation with Deep Utterance Aggregation". COLING(2018) [paper] [code]
- Data-Aug : "Sequence-to-Sequence Data Augmentation for Dialogue Language Understanding". COLING(2018) [paper] [code]
- DC-MMI : "Generating More Interesting Responses in Neural Conversation Models with Distributional Constraints". EMNLP(2018) [paper] [code]
- cVAE-XGate/CGate : "Better Conversations by Modeling, Filtering, and Optimizing for Coherence and Diversity". EMNLP(2018) [paper] [code]
- Retrieval+multi-seq2seq : "An Ensemble of Retrieval-Based and Generation-Based Human-Computer Conversation Systems". IJCAI(2018) [paper]
- DAM : "Multi-Turn Response Selection for Chatbots with Deep Attention Matching Network". ACL(2018) [paper] [code]
- SMN : "Sequential Matching Network: A New Architecture for Multi-turn Response Selection in Retrieval-Based Chatbots". ACL(2017) [paper] [code]
- CVAE/KgCVAE : "Learning Discourse-level Diversity for Neural Dialog Models using Conditional Variational Autoencoders". ACL(2017) [paper] [code]
- TA-Seq2Seq : "Topic Aware Neural Response Generation". AAAI(2017) [paper] [code]
- MA : "Mechanism-Aware Neural Machine for Dialogue Response Generation". AAAI(2017) [paper]
- VHRED : "A Hierarchical Latent Variable Encoder-Decoder Model for Generating Dialogues". AAAI(2017) [paper] [code]
- HRED : "Building End-To-End Dialogue Systems Using Generative Hierarchical Neural Network Models". AAAI(2016) [paper] [code]
- RL-Dialogue : "Deep Reinforcement Learning for Dialogue Generation". EMNLP(2016) [paper]
- MMI : "A Diversity-Promoting Objective Function for Neural Conversation Models". NAACL(2016) [paper] [code]
? Back to Top
Dialogue Evaluation
- DialogBench : "DialogBench: Evaluating LLMs as Human-like Dialogue Systems". NAACL(2024) [paper] [code]
- ChatEval : "ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate". arXiv(2023) [paper] [code]
- ACCENT : "ACCENT: An Automatic Event Commonsense Evaluation Metric for Open-Domain Dialogue Systems". ACL(2023) [paper] [code]
- LLMEval : "Understanding the Effectiveness of Very Large Language Models on Dialog Evaluation". IWSDS(2023) [paper]
- ChatEvalPlatform : "Don't Forget Your ABC's: Evaluating the State-of-the-Art in Chat-Oriented Dialogue Systems". arXiv(2022) [paper] [code]
- MDD-Eval : "MDD-Eval: Self-Training on Augmented Data for Multi-Domain Dialogue Evaluation". AAAI(2022) [paper] [code]
- Self-Eval : "SelF-Eval: Self-supervised Fine-grained Dialogue Evaluation". COLING(2022) [paper] [code]
- FineD-Eval : "FineD-Eval: Fine-grained Automatic Dialogue-Level Evaluation". EMNLP(2022) [paper] [code]
- FlowEval : "FlowEval: A Consensus-Based Dialogue Evaluation Framework Using Segment Act Flows". EMNLP(2022) [paper]
- IM2 : "IM^2: an Interpretable and Multi-category Integrated Metric Framework for Automatic Dialogue Evaluation". EMNLP(2022) [paper] [code]
- Q^2 : "$Q^{2}$: Evaluating Factual Consistency in Knowledge-Grounded Dialogues via Question Generation and Question Answering". EMNLP(2021) [paper] [code]
- QuantiDCE : "Towards Quantifiable Dialogue Coherence Evaluation". ACL(2021) [paper] [code]
- DynaEval : "DynaEval: Unifying Turn and Dialogue Level Evaluation". ACL(2021) [paper] [code]
- Review : "How to Evaluate Your Dialogue Models: A Review of Approaches". arXiv(2021) [paper]
- ConvLabEval : "Is Your Goal-Oriented Dialog Model Performing Really Well? Empirical Analysis of System-wise Evaluation". SIGDIAL(2020) [paper]
- FED : "Unsupervised Evaluation of Interactive Dialog with DialoGPT". SIGDIAL(2020) [paper] [code] [data]
- Spot-the-Bot : "Spot The Bot: A Robust and Efficient Framework for the Evaluation of Conversational Dialogue Systems". EMNLP(2020) [paper] [code]
- CMADE : "Beyond User Self-Reported Likert Scale Ratings: A Comparison Model for Automatic Dialog Evaluation". ACL(2020) [paper] [code]
- Coherence : "Dialogue Coherence Assessment Without Explicit Dialogue Act Labels". ACL(2020) [paper] [code]
- MAUDE : "Learning an Unreferenced Metric for Online Dialogue Evaluation". ACL(2020) [paper] [code]
- GRADE : "GRADE: Automatic Graph-Enhanced Coherence Metric for Evaluating Open-Domain Dialogue Systems". ACL(2020) [paper] [code]
- uBLEU : "uBLEU: Uncertainty-Aware Automatic Evaluation Method for Open-Domain Dialogue Systems". ACL(2020) [paper] [code]
- USR : "USR: An Unsupervised and Reference Free Evaluation Metric for Dialog Generation". ACL(2020) [paper] [code]
- ACUTE-EVAL : "ACUTE-EVAL: Improved Dialogue Evaluation with Optimized Questions and Multi-turn Comparisons". NIPS ConvAI Workshop(2019) [paper] [code]
- InteractiveEval : "Approximating Interactive Human Evaluation with Self-Play for Open-Domain Dialog Systems". NeurIPS(2019) [paper] [code]
- ChatEval : "ChatEval: A Tool for Chatbot Evaluation". NAACL(2019) [paper] [project]
- ADVMT : "One
Ruler for All Languages: Multi-Lingual Dialogue Evaluation with Adversarial Multi-Task Learning". IJCAI(2018) [paper]
? Back to Top
Dialogue Misc.
- Signed-dialogue : "Generating Signed Language Instructions in Large-Scale Dialogue Systems". NAACL(2024) [paper] [data]
- Dialogue-KT : "Exploring Knowledge Tracing in Tutor-Student Dialogues". arXiv(2024) [paper] [code]
- MathDial : "MathDial: A Dialogue Tutoring Dataset with Rich Pedagogical Properties Grounded in Math Reasoning Problems". EMNLP-Findings(2023) [paper] [data]
- EduChat : "EduChat: A Large-Scale Language Model-based Chatbot System for Intelligent Education". arXiv(2023) [paper] [code]
- ACT : "Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training". arXiv(2024) [paper]
- ReviewMT : "Peer Review as A Multi-Turn and Long-Context Dialogue with Role-Based Interactions". arXiv(2024) [paper] [code]
- WildChat : "WildChat: 1M ChatGPT Interaction Logs in the Wild". ICLR(2024) [paper] [data]
- DialOp : "Decision-Oriented Dialogue for Human-AI Collaboration". arXiv(2023) [paper] [code]
- DialogStudio : "DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection for Conversational AI". arXiv(2023) [paper] [code]
- MPC : "Multi-Party Chat: Conversational Agents in Group Settings with Humans and Models". arXiv(2023) [paper] [code]
- SODA : "SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization". EMNLP(2023) [paper] [code]
- speaker-adaptation : "Speaking the Language of Your Listener: Audience-Aware Adaptation via Plug-and-Play Theory of Mind". ACL-Findings(2023) [paper] [code]
- SocialDial : "SocialDial: A Benchmark for Socially-Aware Dialogue Systems". SIGIR(2023) [paper] [data]
- BotsTalk : "BotsTalk: Machine-sourced Framework for Automatic Curation of Large-scale Multi-skill Dialogue Datasets". EMNLP(2022) [paper] [code]
- Dialogic : "Dialogic: Controllable Dialogue Simulation with In-Context Learning". EMNLP-Findings(2022) [paper] [code]
- ProsocialDialog : "ProsocialDialog: A Prosocial Backbone for Conversational Agents". EMNLP(2022) [paper] [code]
- MIC : "The Moral Integrity Corpus: A Benchmark for Ethical Dialogue Systems". ACL(2022) [paper] [code]
- MoralDial : "MoralDial: A Framework to Train and Evaluate Moral Dialogue Systems via Constructing Moral Discussions". arXiv(2022) [paper]
- DECODE : "I like fish, especially dolphins: Addressing Contradictions in Dialogue Modeling". ACL(2021) [paper] [code]
? Back to Top
Natural Language Generation
Survey on NLG
- CTG : "A Survey of Controllable Text Generation using Transformer-based Pre-trained Language Models". arXiv(2022) [paper]
- RTG : "A Survey on Retrieval-Augmented Text Generation". arXiv(2022) [paper]
- Hallucination : "Survey of Hallucination in Natural Language Generation". arXiv(2022) [paper]
- Evaluation : "A Survey of Evaluation Metrics Used for NLG Systems". arXiv(2020) [paper]
? Back to Top
NLG Theories and Techniques
- RED : "Decoder-Only or Encoder-Decoder? Interpreting Language Model as a Regularized Encoder-Decoder". arXiv(2023) [paper]
- LaMemo : "LaMemo: Language Modeling with Look-Ahead Memory". NAACL(2022) [paper] [code]
- PTG : "Learning to Transfer Prompts for Text Generation". NAACL(2022) [paper] [code]
- EISL : "Don't Take It Literally: An Edit-Invariant Sequence Loss for Text Generation". NAACL(2022) [paper] [code]
- CT-Loss : "A Simple Contrastive Learning Objective for Alleviating Neural Text Degeneration". arXiv(2022) [paper] [code]
- SimCTG : "A Contrastive Framework for Neural Text Generation". NeurIPS(2022) [paper] [code]
- CoNT : "CoNT: Contrastive Neural Text Generation". NeurIPS(2022) [paper] [code]
- Two-level-CL : "Keywords and Instances: A Hierarchical Contrastive Learning Framework Unifying Hybrid Granularities for Text Generation". ACL(2022) [paper]
- CLAPS : "Contrastive Learning with Adversarial Perturbations for Conditional Text Generation". ICLR(2021) [paper] [code]
- RetGen : "RetGen: A Joint framework for Retrieval and Grounded Text Generation Modeling". AAAI(2022) [paper] [code]
- RAG : "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks". NeurIPS(2020) [paper] [code]
- TextGAIL : "TextGAIL: Generative Adversarial Imitation Learning for Text Generation". AAAI(2021) [paper] [code]
- Latent-GLAT : " latent -GLAT: Glancing at Latent Variables for Parallel Text Generation". ACL(2022) [paper] [code]
- s2s-ft : "s2s-ft: Fine-Tuning Pretrained Transformer Encoders for Sequence-to-Sequence Learning". arXiv(2021) [paper] [code]
- EBM : "Exposure Bias versus Self-Recovery: Are Distortions Really Incremental for Autoregressive Text Generation?". EMNLP(2021) [paper]
- DiscoDVT : "DiscoDVT: Generating Long Text with Discourse-Aware Discrete Variational Transformer". EMNLP(2021) [paper] [code]
- DATG : "Data Augmentation for Text Generation Without Any Augmented Data". ACL(2021) [paper]
- JointGT : "JointGT: Graph-Text Joint Representation Learning for Text Generation from Knowledge Graphs". ACL-Findings(2021) [paper] [code]
- Embedding-Transfer : "Bridging Subword Gaps in Pretrain-Finetune Paradigm for Natural Language Generation". ACL(2021) [paper] [code]
- FastSeq : "EL-Attention: Memory Efficient Lossless Attention for Generation". ICML(2021) [paper] [code]
- BERTSeq2Seq : "Leveraging Pre-trained Checkpoints for Sequence Generation Tasks". TACL(2020) [paper] [code-tf] [code-py]
- ERNIE-GEN : "ERNIE-GEN: An Enhanced Multi-Flow Pre-training and Fine-tuning Framework for Natural Language Generation". IJCAI(2020) [paper] [code]
- DITTO : "Learning to Break the Loop: Analyzing and Mitigating Repetitions for Neural Text Generation". NeurIPS(2022) [paper] [code]
- Repetition-Problem : "A Theoretical Analysis of the Repetition Problem in Text Generation". AAAI(2021) [paper] [code]
- ENCONTER : "ENCONTER: Entity Constrained Progressive Sequence Generation via Insertion-based Transformer". EACL(2021) [paper] [code]
- POINTER : "POINTER: Constrained Progressive Text Generation via Insertion-based Generative Pre-training". EMNLP(2020) [paper] [code]
- Cascaded Generation : "Cascaded Text Generation with Markov Transformers". NeurIPS(2020) [paper] [code]
- SFOT : "Improving Text Generation with Student-Forcing Optimal Transport". EMNLP(2020) [paper]
- OT-Seq2Seq : "Improving Sequence-to-Sequence Learning via Optimal Transport". ICLR(2019) [paper] [code]
? Back to Top
Diffusion Models for NLG
- RenderDiffusion : "RenderDiffusion: Text Generation as Image Generation". arXiv(2023) [paper]
- Masked-Diffusion-LM : "A Cheaper and Better Diffusion Language Model with Soft-Masked Noise". arXiv(2023) [paper] [code]
- discrete-diffusion : "A Reparameterized Discrete Diffusion Model for Text Generation". arXiv(2023) [paper] [code]
- Difformer : "Difformer: Empowering Diffusion Models on the Embedding Space for Text Generation". arXiv(2023) [paper]
- GENIE : "Text Generation with Diffusion Language Models: A Pre-training Approach with Continuous Paragraph Denoise". arXiv(2022) [paper] [code]
- SED : "Self-conditioned Embedding Diffusion for Text Generation". arXiv(2022) [paper]
- SSD-LM : "SSD-LM: Semi-autoregressive Simplex-based Diffusion Language Model for Text Generation and Modular Control". arXiv(2022) [paper] [code]
- LD4LG : "Latent Diffusion for Language Generation". arXiv(2022) [paper] [code]
- DiffusionBERT : "DiffusionBERT: Improving Generative Masked Language Models with Diffusion Models". arXiv(2022) [paper] [code]
- DiffusER : "DiffusER: Discrete Diffusion via Edit-based Reconstruction". arXiv(2022) [paper] [code]
- SeqDiffuSeq : "SeqDiffuSeq: Text Diffusion with Encoder-Decoder Transformers". arXiv(2022) [paper] [code]
- DiffuSeq : "DiffuSeq: Sequence to Sequence Text Generation with Diffusion Models". ICLR(2023) [paper] [code]
- Diffusion-LM : "Diffusion-LM Improves Controllable Text Generation". NeurIPS(2022) [paper] [code]
- D3PM : "Structured Denoising Diffusion Models in Discrete State-Spaces". NeurIPS(2021) [paper] [code]
? Back to Top
Controllable Generation
- ConGenBench : "Controllable Text Generation in the Instruction-Tuning Era". arXiv(2024) [paper] [code]
- GeLaTo : "Tractable Control for Autoregressive Language Generation". arXiv(2023) [paper]
- Cognac : "Controllable Text Generation with Language Constraints". arXiv(2022) [paper] [code]
- CriticControl : "Critic-Guided Decoding for Controlled Text Generation". arXiv(2022) [paper]
- LatentOps : "Composable Text Controls in Latent Space with ODEs". arXiv(2022) [paper] [code]
- FAST : "FAST: Improving Controllability for Text Generation with Feedback Aware Self-Training". arXiv(2022) [paper]
- DisCup : "DisCup: Discriminator Cooperative Unlikelihood Prompt-tuning for Controllable Text Generation". EMNLP(2022) [paper] [code]
- MultiControl : "A Distributional Lens for Multi-Aspect Controllable Text Generation". EMNLP(2022) [paper] [code]
- NADO : "Controllable Text Generation with Neurally-Decomposed Oracle". NeurIPS(2022) [paper] [code]
- Mix-Match : "Mix and Match: Learning-free Controllable Text Generation using Energy Language Models". ACL(2022) [paper] [code]
- ControlPrefix : "Controllable Natural Language Generation with Contrastive Prefixes". ACL-Findings(2022) [paper]
- MUCOCO : "Controlled Text Generation as Continuous Optimization with Multiple Constraints". NeurIPS(2021) [paper] [code]
- DExperts : "DExperts: Decoding-Time Controlled Text Generation with Experts and Anti-Experts". ACL(2021) [paper] [code]
- FUDGE : "FUDGE: Controlled Text Generation With Future Discriminators". NAACL(2021) [paper] [code]
- GeDi : "GeDi: Generative Discriminator Guided Sequence Generation". EMNLP-Findings(2021) [paper] [code]
- GDC : "A Distributional Approach to Controlled Text Generation". ICLR(2021) [paper] [code]
- CoCon : "CoCon: A Self-Supervised Approach for Controlled Text Generation". ICLR(2021) [paper] [code]
- PPLM : "Plug and Play Language Models: A Simple Approach to Controlled Text Generation". ICLR(2020) [paper] [code]
- CTRL : "CTRL: A Conditional Transformer Language Model for Controllable Generation". arXiv(2019) [paper] [code]
? Back to Top
Text Planning
- CoScript : "Distilling Script Knowledge from Large Language Models for Constrained Language Planning". ACL(2023) [paper] [code]
- RSTGen : "RSTGen: Imbuing Fine-Grained Interpretable Control into Long-FormText Generators". NAACL(2022) [paper]
- Time Control : "Language Modeling via Stochastic Processes". ICLR(2022) [paper] [code]
- PLANET : "PLANET: Dynamic Content Planning in Autoregressive Transformers for Long-form Text Generation". ACL(2022) [paper]
- EventPlan : "Event Transition Planning for Open-ended Text Generation". ACL-Findings(2022) [paper] [code]
- CETP : "Knowledge-based Review Generation by Coherence Enhanced Text Planning". SIGIR(2021) [paper]
- PlanGen : "Plan-then-Generate: Controlled Data-to-Text Generation via Planning". EMNLP-Findings(2021) [paper] [code]
- DYPLOC : "DYPLOC: Dynamic Planning of Content Using Mixed Language Models for Text Generation". ACL(2021) [paper] [code]
- Tree-PLAN : "Infobox-to-text Generation with Tree-like Planning based Attention Network". IJCAI(2020) [paper]
- ProphetNet : "ProphetNet: Predicting Future N-gram for Sequence-to-Sequence Pre-training". EMNLP-Findings(2020) [paper] [code]
- PAIR : "PAIR: Planning and Iterative Refinement in Pre-trained Transformers for Long Text Generation". EMNLP(2020) [paper] [code]
- SentPlan : "Sentence-Level Content Planning and Style Specification for Neural Text Generation". EMNLP(2019) [paper] [code]
- PHVM : "Long and Diverse Text Generation with Planning-based Hierarchical Variational Model". EMNLP(2019) [paper] [code]
- TwinNet : "Twin Networks: Matching the Future for Sequence Generation". ICLR(2018) [paper] [code]
- PAG : "Plan, Attend, Generate: Planning for Sequence-to-Sequence Models". NIPS(2017) [paper]
? Back to Top
Decoding Algorithms
- Speculative Decoding : "Speculative Decoding: Exploiting Speculative Execution for Accelerating Seq2seq Generation". EMNLP-Findings(2023) [paper] [code]
- Medusa : "Medusa: Simple Framework for Accelerating LLM Generation with Multiple Decoding Heads". Github(2023) [Blog] [code]
- Lookahead Decoding : "Breaking the Sequential Dependency of LLM Inference Using Lookahead Decoding". LMSYS Org(2023) [Blog] [code]
- Speculative Sampling : "Accelerating Large Language Model Decoding with Speculative Sampling". arXiv(2023) [paper]
- Speculative Decoding : "Fast Inference from Transformers via Speculative Decoding". ICML(2023) [paper] [code]
- Parallel Decoding : "Accelerating Transformer Inference for Translation via Parallel Decoding". ACL(2023) [paper] [code]
- EAD : "The Stable Entropy Hypothesis and Entropy-Aware Decoding: An Analysis and Algorithm for Robust Natural Language Generation". arXiv(2023) [paper] [code]
- Contrastive Search : "Contrastive Search Is What You Need For Neural Text Generation". TMLR(2023) [paper] [code] [blog]
- Momentum Decoding : "Momentum Decoding: Open-ended Text Generation As Graph Exploration". arXiv(2022) [paper] [code]
- Crowd Sampling : "Follow the Wisdom of the Crowd: Effective Text Generation via Minimum Bayes Risk Decoding". arXiv(2022) [paper] [code]
- RankGen : "RankGen: Improving Text Generation with Large Ranking Models". EMNLP(2022) [paper] [code]
- Contrastive Decoding : "Contrastive Decoding: Open-ended Text Generation as Optimization". arXiv(2022) [paper] [code]
- COLD : "COLD Decoding: Energy-based Constrained Text Generation with Langevin Dynamics". NeurIPS(2022) [paper] [code]
- Lattice : "Massive-scale Decoding for Text Generation using Lattices". NAACL(2022) [paper] [code]
- KID : "Knowledge Infused Decoding". ICLR(2022) [paper] [code]
- NeuroLogic A*esque : "NeuroLogic A *esque Decoding: Constrained Text Generation with Lookahead Heuristics". NAACL(2022) [paper] [code]
- NeuroLogic : "NeuroLogic Decoding: (Un)supervised Neural Text Generation with Predicate Logic Constraints". NAACL(2021) [paper] [code]
- DeLorean : "Back to the Future: Unsupervised Backprop-based Decoding for Counterfactual and Abductive Commonsense Reasoning". EMNLP(2020) [paper] [code]
- Top-p (Nucleus) Sampling : "The Curious Case of Neural Text Degeneration". ICLR(2020) [paper] [code]
- BP Decoding : "Blockwise Parallel Decoding for Deep Autoregressive Models". NIPS(2018) [paper]
- Disjunctive Constraints : "Guided Generation of Cause and Effect". IJCAI(2020) [paper] [code-huggingface]
- CGMH : "CGMH: Constrained Sentence Generation by Metropolis-Hastings Sampling". AAAI(2019) [paper] [code]
- DBS : "Directed Beam Search: Plug-and-Play Lexically Constrained Language Generation". arXiv(2020) [paper] [code]
- DBA : "Fast Lexically Constrained Decoding with Dynamic Beam Allocation for Neural Machine Translation". NAACL(2018) [paper] [code-official] [code-fairseq]
- GBS : "Lexically Constrained Decoding for Sequence Generation Using Grid Beam Search". ACL(2017) [paper] [code]
? Back to Top
NLG Evaluation
- Survey : "Leveraging Large Language Models for NLG Evaluation: A Survey". arXiv(2024) [paper]
- BBScore : "BBScore: A Brownian Bridge Based Metric for Assessing Text Coherence". AAAI(2024) [paper]
- GPTEval : "GPTEval: NLG Evaluation using GPT-4 with Better Human Alignment". arXiv(2023) [paper]
- GPTScore : "GPTScore: Evaluate as You Desire". arXiv(2023) [paper] [code]
- RoMe : "RoMe: A Robust Metric for Evaluating Natural Language Generation". ACL(2022) [paper] [code]
- EAD : "Rethinking and Refining the Distinct Metric". ACL(2022) [paper] [code]
- MID : "Mutual Information Divergence: A Unified Metric for Multimodal Generative Models". NeurIPS(2022) [paper]
- DiscoScore : "DiscoScore: Evaluating Text Generation with BERT and Discourse Coherence". arXiv(2022) [paper] [code]
- CTC-Score : "Compression, Transduction, and Creation: A Unified Framework for Evaluating Natural Language Generation". EMNLP(2021) [paper] [code]
- BLEURT : "BLEURT: Learning Robust Metrics for Text Generation". ACL(2020) [paper] [code]
? Back to Top