Paper-Reading-Convai
Liste de lecture de papier dans l'IA conversationnelle, englobant principalement les systèmes de dialogue et la génération de langage naturel . Ce référentiel est constamment mis à jour? ...
- Deep Learning in PNL
- Systèmes de dialogue
- Enquête sur le dialogue
- LLMS conversationnels
- Dialogue multimodal
- Dialogue situé et incarné
- Dialogue visuellement
- Dialogue proactif
- Mis. de dialogue proactif
- Dialogue axé sur la cible
- Dialogue non collaboratif (persuasion et négociation)
- Dialogue personnalisé
- Dialogue basé sur les personnages
- Dialogue de la personnalité
- Dialogue basé sur la personne
- Dialogue émotionnel
- Dialogue de soutien émotionnel
- Dialogue empathique
- Dialogue de recommandation et CRS
- Dialogue sur les connaissances
- Dialogue axé sur les tâches
- Dialogue sur le domaine ouvert
- Dialogue à long terme
- Génération de réponse
- Évaluation du dialogue
- Dialogue Misc.
- Génération de langage naturel
- Enquête sur NLG
- Théories et techniques NLG
- Modèles de diffusion pour NLG
- Génération contrôlable
- Planification de texte
- Algorithmes de décodage
- Évaluation NLG
Deep Learning in PNL
- INLP : "Traitement interactif du langage naturel". arXiv (2023) [papier]
- Augmentation des données : "Une étude des approches d'augmentation des données pour la PNL". Troises du LCA (2021) [Papier]
- Inviter : "pré-train, rapide et prédire: une étude systématique des méthodes d'incitation dans le traitement du langage naturel". arXiv (2021) [papier]
- Portée du monde de la PNL : "Expérience foncière la langue". EMNLP (2020) [papier]
- Transformateur-XL : "Transformer-XL: Modèles de langage attentif au-delà d'un contexte de longueur fixe". ACL (2019) [Paper] [Code]
- Transformateur : "L'attention est tout ce dont vous avez besoin". Neirips (2017) [Paper] [Code-officiel] [Code-TF] [Code-PY]
- VAE : "Une introduction aux autoencoders variationnels". Arxiv (2019) [papier]
- Enquête sur l'attention : "Une étude d'introduction sur les mécanismes d'attention dans les problèmes de PNL". Arxiv (2018) [papier]
- Attention additive : "Traduction de machine neuronale en apprenant conjointement à aligner et à traduire". ICLR (2015) [papier]
- Attention multiplicative : "Approches efficaces de la traduction machine neuronale basée sur l'attention". EMNLP (2015) [papier]
- Memory Net : "Réseaux de mémoire de bout en bout". NEIRIPS (2015) [Papier]
- Mécanisme de copie (PGN) : "Aller au point: Résumé avec les réseaux de générateur de pointeur". ACL (2017) [Paper] [Code]
- Mécanisme de copie : "Incorporer le mécanisme de copie dans l'apprentissage de séquence à la séquence". ACL (2016) [document]
- Elmo : "Représentations des mots contextualisés profonds". NAACL (2018) [Papier] [Code]
- GLANT : "GLANT: GLOBAL VECTORS POUR la représentation des mots". EMNLP (2014) [Paper] [Code]
- Tutoriel Word2Vec : "Learning Word2Vec Learning Explication". Arxiv (2016) [papier]
- Apprentissage multi-tâches : "Un aperçu de l'apprentissage multi-tâches dans les réseaux de neurones profonds". Arxiv (2017) [papier]
- Descente du gradient : "Un aperçu des algorithmes d'optimisation de descente de gradient". Arxiv (2016) [papier]
? Retour en haut
Systèmes de dialogue
Enquête sur le dialogue
- Génération de données : "Une enquête sur les progrès récents de la génération de données conversationnels". arXiv (2024) [papier]
- Dialogue proactif : "Une enquête sur les systèmes de dialogue proactifs: problèmes, méthodes et prospects". Ijcai (2023) [papier]
- Dialogue responsable : "Avancées récentes vers des systèmes de dialogue sûrs, responsables et moraux: une enquête". arXiv (2023) [papier]
- Dialogue sur la négociation : "Négociez! Une enquête sur les systèmes de dialogue de négociation". arXiv (2022) [papier]
- Dialogue basé sur DL : "Avancées récentes dans les systèmes de dialogue basés sur l'apprentissage en profondeur: une enquête systématique". arXiv (2021) [papier]
- Dialogue du domaine ouvert : "Défis dans la construction de systèmes de dialogue intelligents du domaine ouvert". Tois (2020) [papier]
- Systèmes de dialogue : "Une enquête sur les systèmes de dialogue: avancées récentes et nouvelles frontières". SIGKDD Explorations (2017) [Papier]
- Corporations de dialogue : "Une enquête sur les corpus disponibles pour la création de systèmes de dialogue basés sur les données". Arxiv (2017) [Papier] [Données]
? Retour en haut
LLMS conversationnels
- Parrot : "Parrot: améliorer les modèles de chat multi-tours en apprenant à poser des questions". arXiv (2023) [papier]
- Memochat : "Memochat: Tuning LLMS pour utiliser des mémos pour une conversation à domaine ouvert à longue portée cohérente". arXiv (2023) [papier]
- LLAMA 2-CHAT : "LLAMA 2: Fondation ouverte et modèles de chat affinés". Méta (2023) [papier] [code]
- ChatGlm3 : "Série ChatGlm3: Open Bilingual Chat LLMS". Tsinghua (2023) [code]
- Chatglm2-6b : "chatGlm2-6b: un chat bilingue ouvert llm". Tsinghua (2023) [code]
- MPC : "Invited LLMS en tant que modules de chatbot pour une longue conversation à domaine ouvert". ACL-Findings (2023) [Paper] [Code]
- MemoryBank-Silicon Afriend : "MemoryBank: Amélioration des modèles de langues grands avec mémoire à long terme". arXiv (2023) [papier] [code]
- Ultrachat : "Améliorer les modèles de langage de chat en élargissant les conversations pédagogiques de haute qualité". arXiv (2023) [papier] [données]
- Chatalpaca : "Chatalpaca: un corpus de dialogue multi-tours basé sur les instructions alpaca". Github (2023) [données]
- Phoenix : "Phoenix: démocratisation du chatpt à travers les langues". arXiv (2023) [papier] [code]
- Dolly : "Free Dolly: Présentation de la première LLM à instruction vraiment ouverte du monde". Databricks (2023) [Code]
- Baize : "Baize: un modèle de chat open source avec un réglage économe en paramètres sur les données d'auto-chat". arXiv (2023) [papier] [code]
- Vicuna : "Vicuna: un chatbot open source impressionnant GPT-4 avec une qualité de chatppt à 90%". LMSYS ORG (2023) [BLOG] [CODE]
- Koala : "Koala: un modèle de dialogue pour la recherche universitaire". UC Berkeley (2023) [Blog] [Code]
- Belle : "Belle: Soyez le grand moteur de modèle de langue de tout le monde". Lianjatech (2023) [code]
- Alpaga : "Alpaga: un modèle de suivi des instructions fort et reproductible". Stanford (2023) [Blog] [Code] [Alpaca-Lora]
- ChatGLM-6B : "Un modèle de langage de dialogue bilingue ouvert". Tsinghua (2023) [code]
- Assistant ouvert : "Assistant ouvert: AI conversationnel pour tout le monde". GitHub (2023) [Projet] [Code]
- Chatgpt : "Chatgpt: Optimiser les modèles de langue pour le dialogue". Openai (2022) [Blog]
- Sparrow : "Améliorer l'alignement des agents de dialogue via des jugements humains ciblés". arXiv (2022) [papier] [données]
- BlenderBot3 : "Blenderbot 3: un agent conversationnel déployé qui apprend continuellement à s'engager de manière responsable". arXiv (2022) [papier]
- Lamda : "Lamda: Modèles de langue pour les applications de dialogue". arXiv (2022) [papier]
- GOBEL : "GODEL: pré-formation à grande échelle pour le dialogue dirigé par des objectifs". arXiv (2022) [papier] [code]
- Assistant anthropique-V2 : "Former un assistant utile et inoffensif avec apprentissage du renforcement des commentaires humains". arXiv (2022) [papier]
- Assistant anthropique : "Un assistant de langue générale en tant que laboratoire d'alignement". arXiv (2021) [papier]
? Retour en haut
Dialogue multimodal
Dialogue situé et incarné
- SLL : "Dialogues situationnels basés sur un modèle de grande langue pour l'apprentissage d'une langue seconde". arXiv (2024) [papier]
- EMB-Plan : "Plane de plan incarné multimodal augmentée avec un dialogue incarné synthétique". EMNLP (2023) [papier]
- WTAG : "Les modèles de fondation peuvent-ils regarder, parler et vous guider étape par étape pour faire un gâteau?". EMNLP-Findings (2023) [Paper] [Code]
- SIMMC-VR : "SIMMC-VR: Un ensemble de données de dialogue multimodal orienté tâches avec des flux VR situés et immersifs". ACL (2023) [papier]
- Bien sûr : "Dialogue de recommandation multimodale avec préférence subjective: un nouveau défi et une référence". ACL (2023) [Paper] [Données]
- Sugar : "Un ensemble de données textuel pour la sélection de réponse proactive située". ACL (2023) [Paper] [Données]
- Minddial : "Minddial: Dynamique des croyances suivi avec la modélisation de la théorie de l'esprit pour la génération de dialogue neuronale située". arXiv (2023) [papier]
- Holoassist : "Holoassiste: un ensemble de données à interaction humaine égocentrique pour les assistants interactifs d'IA dans le monde réel". ICCV (2023) [Paper] [Données]
- Collaboration : "vers l'acquisition de plan collaboratif par la théorie de la modélisation de l'esprit dans le dialogue situé". Ijcai (2023) [papier] [code]
- Alexa Arena : "Alexa Arena: une plate-forme interactive centrée sur l'utilisateur pour l'intermédiaire d'incarnation". arXiv (2023) [papier] [code]
- Seagull : "Seagull: un agent incarné pour les instructions suivant le dialogue situé". Alexa Prize Simbot Challenge (2023) [document]
- Sitcom-Det : "Auquel parlez-vous? Identification des objets multimodaux dans le dialogue situé". EACL-SRW (2023) [Paper] [Code]
- MLR : "Améliorer les agents conversationnels situés avec un raisonnement logique multimodal étape par étape". DSTC11 (2023) [papier]
- Simplemtod : "Simplemtod: un modèle de langage simple pour le dialogue multimodal axé sur les tâches avec représentation de scène symbolique". arXiv (2023) [papier]
- Spring : "Spring: Agent de conversation situé pré-entraîné avec des questions multimodales du graphique de mise en page incrémentiel". Aaai (2023) [papier] [code]
- Dorothie : "Dorothie: Dialogue parlé pour gérer des situations inattendues dans les agents de conduite autonomes interactifs". EMNLP-Findings (2022) [Paper] [Code]
- Curriculum léger : "Apprentissage du dialogue situé à travers la génération d'environnement procédurale". ACL (2022) [papier]
- Danli : "Danli: agent délibératif pour suivre les instructions du langage naturel". EMNLP (2022) [Paper] [Code]
- PRS : "Apprendre à médier les disparités envers la communication pragmatique". ACL (2022) [Paper] [Code]
- Modèle conjoint : "Apprendre à intégrer des contextes multimodaux pour les agents conversationnels situés". NAACL-Findings (2022) [Paper] [Code]
- Teach_Film : "Ne copiez pas l'enseignant: les données et les défis du modèle dans le dialogue incarné". EMNLP (2022) [Paper] [Code]
- Teach : "Teach: Agents incarnés axés sur les tâches qui discutent". Aaai (2022) [papier] [données]
- Mindcraft : "Mindcraft: Théorie de la modélisation de l'esprit pour le dialogue situé dans les tâches collaboratives". EMNLP (2021) [Paper] [Code]
- Modèle multimodal : "Interactions multimodales utilisant des modèles unimodaux pré-entraînés pour SIMMC 2.0". DSTC10 (2022) [Paper] [Code]
- SIMMC 2.0 : "SIMMC 2.0: un ensemble de données de dialogue axé sur les tâches pour les conversations multimodales immersives" EMNLP (2021) [Paper] [Code]
- MM-DST : "Apprentissage multi-tâches pour les systèmes de dialogue de bout en bout à domaine situé". arXiv (2021) [papier]
- SIMMC : "Conversations multimodales situées et interactives". Coling (2020) [papier] [code]
- Minecraft-bap : "Apprendre à exécuter des instructions dans un dialogue Minecraft". ACL (2020) [Paper] [Code]
- Céréale : "Exécution d'instructions dans des interactions collaboratives situées". EMNLP (2019) [Paper] [Code]
- Dialogue Minecraft : "Dialogue collaboratif dans Minecraft". ACL (2019) [Paper] [Code]
- CLG : "Langage collaboratif Masser vers le dialogue Human-Robot situé". AI Magazine (2016) [papier]
- SHRD : "Back to the Blocks World: Apprendre de nouvelles actions à travers le dialogue situé par l'homme-robot". Sigdial (2014) [document]
Dialogue visuellement
- Tiger : "Tiger: un cadre de modèle génératif unifié pour la génération de réponse de dialogue multimodale". Coling (2024). [papier] [Code]
- Dialogcc : "Dialogcc: un pipeline automatisé pour créer un ensemble de données de dialogue multimodal de haute qualité". NAACL (2024) [Papier] [Données]
- VLAW-MDM : "Un cadre pour les tâches d'échauffement de la vision dans les modèles de dialogue multimodal". EMNLP (2023) [Paper] [Code]
- ZRIGF : "ZRIGF: Un cadre multimodal innovant pour la génération de dialogue à l'image à ressources zéro". ACM MM (2023) [Paper] [Code]
- Vdialogue : "Vdialogue: une référence d'évaluation unifiée pour le dialogue visuellement fondé". arXiv (2023) [papier]
- TextBind : "TextBind: le suivi multimodal entre les virages multiples, le suivi de l'instruction dans la nature". arXiv (2023) [papier] [données]
- VSTAR : "VSTAR: un ensemble de données de dialogue vidéo à la carte vidéo pour une compréhension sémantique située avec des transitions de scène et de sujet". ACL (2023) [Paper] [Données]
- Comset : "Génération de dialogues comiques basée sur la personnalité multimodale". ACL (2023) [Paper] [Code]
- MPCHAT : "MPCHAT: Vers la conversation multimodale fondée sur la personnalité". ACL (2023) [Paper] [Code]
- PACE : "PACE: Dialogue multimodal unifié Pré-formation avec des experts progressifs et de composition". ACL (2023) [Paper] [Code]
- MMDIALOG : "MMDIALOG: Un jeu de données de dialogue multi-tour à grande échelle vers une conversation multimodale à domaine ouvert". ACL (2023) [Paper] [Données]
- MDS-S2 : "Double connaissances sémantiques composées de systèmes de dialogue multimodal". Sigir (2023) [papier]
- Tiktalk : "Tiktalk: un ensemble de données de dialogue multimodal pour le chitchat du monde réel". arXiv (2023) [papier] [code]
- Champagne : "Champagne: apprendre la conversation du monde réel à partir de vidéos Web à grande échelle". arXiv (2023) [papier] [code]
- MMCHAT : "MMCHAT: ensemble de données de chat multimodal sur les réseaux sociaux". LREC (2022) [Paper] [Code]
- CRVD : "Raisonnement collaboratif sur les graphiques sémantiques multimodaux pour la génération de dialogue vidéo". EMNLP-Findings (2022) [papier]
- M3ED : "M3ED: Multi-modal Multi-Scene Multi-Babel Emotional Dialogue Base". ACL (2022) [Paper] [Données]
- MDRG : "Génération de réponse de dialogue multimodale". ACL (2022) [papier]
- UNITRANSER : "UNITRANSER: Un cadre de représentation sémantique de transformateur unifié pour le système de dialogue orienté tâches multimodal". ACL (2022) [papier]
- Photochat : "Photochat: un ensemble de données de dialogue humain humain avec comportement de partage de photos pour la modélisation conjointe de texte d'image". ACL (2021) [Paper] [Données]
- Dialogue multimodal : "Construire un ensemble de données de dialogue multimodal en remplaçant le texte par des images sémantiquement pertinentes". ACL (2021) [Paper] [Code]
- Openvidial 2.0 : "Openvidial 2.0: un ensemble de données de génération de dialogue à plus grande échelle et à domaine ouvert avec des contextes visuels". arXiv (2021) [papier] [données]
- Treasure : "Système de dialogue multimodal: compréhension de la question du contexte basé sur des graphiques relationnels". ACM MM (2021) [Paper] [Code]
- MMCONV : "MMCONV: un environnement pour la recherche conversationnelle multimodale dans plusieurs domaines". Sigir (2021) [Paper] [Données]
- Chat d'image : "Chat d'image: engageant des conversations fondées". ACL (2020) [Papier] [Données]
- MTN : "Réseaux de transformateurs multimodaux pour les systèmes de dialogue vidéo de bout en bout". ACL (2019) [Paper] [Code]
- Meld : "Meld: un ensemble de données multimodal multipartite pour la reconnaissance des émotions dans les conversations". ACL (2019) [Papier] [Données]
- CLEVR-DIALOG : "CLEVR-DIALOG: Un ensemble de données de diagnostic pour le raisonnement multi-ronde dans la boîte de dialogue visuel". NAACL (2019) [Papier] [Données]
- Visdial-RL : "Améliorer le dialogue visuel génératif en répondant à diverses questions". EMNLP (2019) [Paper] [Code]
- Magic : "Système de dialogue multimodal: générer des réponses via des décodeurs adaptatifs". ACM MM (2019) [Paper] [Code]
- KMD : "Systèmes de dialogue multimodaux conscients des connaissances". ACM MM (2018) [Paper]
- MMD : "Vers la construction de systèmes de conversation multimodaux à grande échelle". AAAI (2018) [Papier] [Données]
- Parlez de la marche : "Parlez de la promenade: naviguer dans la ville de New York grâce à un dialogue fondé sur la terre". Arxiv (2018) [Papier] [Code]
- IGC : "Conversations d'image: contexte multimodal pour la génération naturelle de questions et de réponse". IJCNLP (2017) [Papier] [Données]
- Visdial : "Dialogue visuel". CVPR (2017) [Papier] [Données]
? Retour en haut
Dialogue proactif
Mis. de dialogue proactif
- DPDP : "Planification comme humain: un cadre à double processus pour la planification du dialogue". ACL (2024) [Paper] [Code]
- PCA : "Vers des agents conversationnels proactifs centrés sur l'homme". Sigir (2024) [papier]
- Procot : "Inviter et évaluer des modèles de gros langues pour les dialogues proactifs: clarification, guidé par la cible et non-collaboration". EMNLP-Findings (2023) [Paper] [Code]
- Tutoriel : "La conscience de l'objectif pour l'IA conversationnelle: proactivité, non-collaborativité et au-delà". ACL (2023) [papier]
Dialogue axé sur la cible
- Pai : "Vers les systèmes de tutorat intelligents axés sur les objectifs dans l'éducation en ligne". arXiv (2023) [papier]
- TopDial : "Systèmes de dialogue proactifs orientés cibles avec personnalisation: formulation du problème et conservation de l'ensemble de données". EMNLP (2023) [Paper] [Code]
- RTCP : "Promotion conversationnelle renforcée par cible". EMNLP (2023) [Paper] [Code]
- MTGP : "MTGP: Dialogue à plusieurs tours de tournage guidé par un chemin global génératif avec des virages flexibles". ACL-Findings (2023) [Paper] [Code]
- Couleur : "Planification du dialogue via le processus stochastique du pont brownien pour le dialogue proactif dirigé par des objectifs". ACL-Findings (2023) [Paper] [Code]
- TOPKG : "Topkg: boîte de dialogue orientée cible via la planification globale sur le graphique de connaissances". Coling (2022) [papier] [code]
- TGCP : "Planification de conversation à domaine ouvert guidé par la cible". Coling (2022) [papier] [code]
- FOP : "Contrôle à long terme pour la génération de dialogue: méthodes et évaluation". NAACL (2022) [Paper] [Code]
- CODA : "Génération de réponse de dialogue guidée par la cible en utilisant le bon sens et l'augmentation des données". NAACL-Findings (2022) [Paper] [Code]
- Otters : "Otters: transitions de sujet à un tour pour le dialogue du domaine ouvert". ACL (2021) [Paper] [Données]
- CG-NAR : "Penser clairement, parler vite: génération non autorégressive guidée par le concept pour les systèmes de dialogue à domaine ouvert". EMNLP (2021) [Paper] [Code]
- Duconv : "Conversation proactive de la machine humaine avec des objectifs de conversation explicites". ACL (2019) [Paper] [Code]
- CKC : "Modèle conversationnel neuronal guidé par mot-clé". Aaai (2021) [papier] [code]
- Knowhrl : "Graphique des connaissances fondée sur l'objectif fondé sur la planification des objectifs pour la génération de conversation du domaine ouvert". AAAI (2020) [papier]
- DKRN : "Réseau de routage des connaissances dynamiques pour la conversation à domaine ouvert guidé par la cible". Aaai (2020) [papier] [code]
- TGCONV : "Conversation de domaine ouvert guidé par la cible". ACL (2019) [Paper] [Code]
Dialogue non collaboratif (persuasion et négociation)
- Trip : "La force réside dans les différences! Vers des dialogues efficaces non collaboratifs via une planification de stratégie sur mesure". arXiv (2024) [papier]
- Ina : "Ina: une approche intégrative pour améliorer les stratégies de négociation avec le système de dialogue basé sur la récompense". EMNLP (2023) [Paper] [Données]
- I-Pro : "Interaction avec l'utilisateur non coopératif: un nouveau paradigme pour la politique de dialogue proactif". Sigir (2022) [papier]
- PAAD : "Vers un agent de dialogue autonome conscient de la progression". NAACL (2022) [Paper] [Code]
- Persrfi : "Affiner et imiter: réduire la répétition et l'incohérence dans les dialogues de persuasion via l'apprentissage du renforcement et la démonstration humaine". EMNLP-Findings (2021) [Paper] [Code]
- Resper : "Resper: Modélisation de la modélisation par calcul des stratégies de résistance dans les conversations persuasives". EACL (2021) [Paper] [Code]
- ARDM : "Modèle de dialogue récurrent alterné avec des modèles de langage pré-formé à grande échelle". EACL (2021) [Paper] [Code]
- Dialograph : "Dialograph: Incorporer des réseaux de stratégie interprétables dans les dialogues de négociation". ICLR (2021) [Paper] [Code]
- NégociationTom : "Améliorer les systèmes de dialogue pour la négociation avec la modélisation de la personnalité". ACL (2021) [Paper] [Code]
- Fehed : "Augmenter les systèmes de dialogue non collaboratifs avec une histoire de dialogue sémantique et stratégique explicite". ICLR (2020) [Paper] [Code]
- CTX-PSA : "Apprendre à planifier et à réaliser séparément pour les systèmes de dialogue ouverts". EMNLP-Findings (2020) [Paper] [Code]
- Coach de négociation : "un coach de stratégie dynamique pour une négociation efficace". Sigdial (2019) [Papier] [Code]
- Persuasionforgood : "Persuasion pour de bon: vers un système de dialogue persuasif personnalisé pour le bien social". ACL (2019) [Papier] [Données]
- CraigslistBargain : "Découplage Stratégie et génération dans les dialogues de négociation". EMNLP (2018) [Papier] [Données]
? Retour en haut
Dialogue personnalisé
Dialogue basé sur les personnages
- LLM-Werewolf : "Explorer des modèles de grands langues pour les jeux de communication: une étude empirique sur le loup-garou". arXiv (2023) [papier]
- Chatharuhi : "Chatharuhi: relance du caractère d'anime dans la réalité via un modèle grand langage". arXiv (2023) [rapport] [Code]
- DPCD : "Salut Sheldon! Création de personnages personnalisés profonds à partir d'émissions de télévision". arXiv (2023) [papier] [données]
- Cornell-Rich : "Modélisation de langage personnalisée des caractères d'écran utilisant de riches annotations de métadonnées". arXiv (2023) [papier] [données]
- Kundge : "Génération ontologiquement fidèle de dialogues de personnages non joués". Arxique (2022) [papier]
- HPD : "Les modèles de grands langues rencontrent Harry Potter: un ensemble de données bilingues pour aligner les agents de dialogue avec les personnages". arXiv (2022) [papier] [données]
- Dialstory : "Une référence pour comprendre et générer un dialogue entre les personnages dans les histoires". arXiv (2022) [papier]
- Carecall : "Construire un rôle spécifié du système de dialogue à domaine ouvert tirant parti des modèles de langage à grande échelle". NAACL (2022) [Papier] [Données]
- PDP : "Rencontrez votre personnage préféré: chatbot à domaine ouvert imitant des personnages fictifs avec seulement quelques énoncés". NAACL (2022) [Paper] [Code]
- RPA : "Suis-je moi ou moi? Les modèles de dialogue de pointe ne peuvent pas maintenir une identité". NAACL-Findings (2022) [papier]
- PersatorChat : "CharacterChat: soutenir la création de personnages fictifs par la conversation et la manifestation progressive avec un chatbot". ACM C&C (2021) [papier]
- Aloha : "Aloha: apprentissage artificiel des attributs humains pour les agents de dialogue". Aaai (2020) [papier] [code]
- Lumière : "Apprendre à parler et à agir dans un jeu d'aventure en texte fantastique". EMNLP (2019) [Papier] [Données]
Dialogue de la personnalité
- UBPL : "Adapter les traits de personnalité dans les modèles de grands langues via des lexiques personnalisés non surveillés". arXiv (2023) [papier]
- PersacterChat : "CharacterChat: Apprendre vers une IA conversationnelle avec un soutien social personnalisé". arXiv (2023) [papier] [code]
- ChatGpt-MBTI : "Le chatppt peut évaluer les personnalités humaines? Un cadre d'évaluation général". arXiv (2023) [papier] [code]
- Personnalité invitée : "Contrôle du style de personnalité en dialogue avec un apprentissage basé sur un coup de zéro". IWSDS (2023) [papier]
- CPED : "CPED: Un jeu de données de dialogue personnalisé et émotionnel chinois à grande échelle pour l'IA conversationnelle". arXiv (2022) [papier] [données]
- Peld : "Sélectionnez automatiquement l'émotion pour la réponse via la transition émotionnelle affectée par la personnalité". ACL-Findings (2021) [Papier] [Données]
- FriendsPersona : "Reconnaissance automatique de la personnalité textuelle sur les monologues et les dialogues multipartites à l'aide de réseaux attentifs et d'incorporation contextuelle". AAAI-Student Résumé (2020) [Papier] [Données]
- APR : "Identifier les traits de personnalité en utilisant la dynamique de chevauchement dans le dialogue multipartite". IntereSpeech (2019) [Papier]
- PersonalDilaog : "Génération de dialogue personnalisée avec des traits diversifiés". Arxiv (2019) [Papier] [Données]
- Personagenlg : "contrôler la variation stylistique basée sur la personnalité avec les générateurs de langage naturel neuronal". Sigdial (2018) [Papier] [Données]
Dialogue basé sur la personne
- Comperdial : "ComperDial: ensemble de données de dialogue et de référence à la personnalité Communsense Persona,". arXiv (2024) [papier]
- IDL : "" Dans les dialogues, nous apprenons ": vers un dialogue personnalisé sans profils prédéfinis grâce à l'apprentissage en dialogue". arXiv (2024) [papier]
- Dialogicl : "Création d'une bonne invite ou fournissant des dialogues exemplaires? Une étude de l'apprentissage en contexte pour la génération de dialogue basée sur la personnalité". arXiv (2024) [papier]
- Varmi : "Construire des agents de dialogue cohérents de personnage avec apprentissage en renforcement hors ligne". EMNLP (2023) [Paper] [Code]
- Opela : "Quand Crowd rencontre Persona: Création d'un corpus de dialogue Persona Open-Domain à grande échelle". arXiv (2023) [papier] [données]
- Orig : "Vers une génération de dialogue personnalisée robuste via la régularisation de la représentation insensible à l'ordre". ACL-Findings (2023) [Paper] [Code]
- CLV : "Améliorer la génération de dialogue personnalisée avec des variables latentes contrastives: combinant un personnage clairsemé et dense". ACL (2023) [Paper] [Code]
- SIMOAP : "SIMOAP: Améliorer la cohérence et la cohérence de la génération de dialogue basée sur la personnalité via un sur-échantillonnage et après l'évaluation". ACL (2023) [Paper] [Code]
- LMEDR : "Apprendre à mémoriser des relations avec les dialogues consistents en matière d'impression et de discours pour les dialogues consistents". Aaai (2023) [papier] [code]
- Retriel-to-prédiction : "Améliorer la cohérence de la personnalité dans la conversation par l'étendue de Persona". CIKM (2022) [Paper] [Code]
- Personne implicite : "Un générateur de dialogue personnalisé avec une détection implicite de la personnalité utilisateur". Coling (2022) [papier]
- CareCallMemory : "Gardez-moi au courant! Gestion de la mémoire dans les conversations à long terme". EMNLP-Findings (2022) [Paper] [Data]
- Personadefense : "Vous ne connaissez pas ma couleur préférée: empêcher les représentations de dialogue de révéler les personnages privés des orateurs". NAACL (2022) [Paper] [Code]
- Taune rapide : "Construire un système de dialogue personnalisé avec un réglage rapide". NAACL-SRW (2022) [papier]
- DULEMON : "Long Time No See! Open Domain Conversation avec la mémoire de personnage à long terme". ACL-Findings (2022) [Papier] [Données]
- Info : "Vous comprenez vraiment ce dont j'ai besoin: des agents de dialogue intellectuels et amicaux ancrant les connaissances et la personnalité". EMNLP-Findings (2022) [Paper] [Code]
- Focus : "Appelez pour une conversation personnalisée: une conversation personnalisée Persona et des connaissances". Aaai (2022) [papier] [code]
- MSP : "moins c'est plus: apprendre à affiner l'histoire du dialogue pour la génération de dialogue personnalisée". NaaCl (2022) [papier]
- GME : "Dialogues transférables à la personne via des modifications minimales fondées". EMNLP (2021) [Paper] [Code]
- Bob : "Bob: Bert sur Bert pour la formation de modèles de dialogue basés sur des personnalités à partir de données personnalisées limitées". ACL (2021) [Paper] [Code]
- Pabst : "Enrichissement non supervisé de la boîte de dialogue fondée sur Persona avec des histoires de fond". ACL (2021) [Paper] [Code]
- DHAP : "Un chatbot par personne: création de chatbots personnalisés basés sur des profils utilisateur implicites". Sigir (2021) [papier]
- PCHATBOT : "PCHATBOT: Un ensemble de données à grande échelle pour le chatbot personnalisé". Sigir (2021) [Paper] [Données]
- Compac : "Comme la randonnée? Vous aimez probablement la nature: la boîte de dialogue fondée sur le personnage avec des extensions de bon sens". EMNLP (2020) [Paper] [Code]
- Conscience pragmatique : "Vais-je me ressembler? Améliorer la cohérence des dialogues par la conscience pragmatique". EMNLP (2020) [Paper] [Code]
- XPERSONA : "XPERSONA: Évaluation du chatbot personnalisé multilingue". arXiv (2020) [papier] [données]
- KVPI : "Identification de cohérence du profil pour les agents de dialogue du domaine ouvert". EMNLP (2020) [Paper] [Code]
- GDR : "Générer, supprimer et réécrire: un cadre en trois étapes pour améliorer la cohérence de la personnalité de la génération de dialogue". ACL (2020) [papier]
- P ^ 2bot : "Vous m'impressionnez: génération de dialogue via la perception de la personnalité mutuelle". ACL (2020) [Paper] [Code]
- RCDG : "Générer des dialogues cohérents de la personnalité en exploitant l'inférence du langage naturel". Aaai (2020) [papier] [code]
- Persona-SPASSE : "Un modèle de génération de dialogue personnalisé en pré-formation avec des données SPARS". AAAI (2020) [papier]
- Personawae : "Modélisation de la personnalisation dans un espace continu pour la génération de réponse via des autoencoders augmentés de Wasserstein". EMNLP (2019) [papier]
- PAML : "Personnaliser les agents de dialogue via Meta-Learning". ACL (2019) [Paper] [Code]
- Personachat : "Personnaliser les agents de dialogue: j'ai un chien, avez-vous aussi des animaux de compagnie?" ACL (2018) [Papier] [Données]
- PCCM : "Attribuer une personnalité / profil à une machine de chat pour une génération de conversation cohérente". Ijcai (2018) [papier]
? Retour en haut
Dialogue émotionnel
Dialogue de soutien émotionnel
- Biais de préférence : "Les modèles de grands langues peuvent-ils être un bon partisan émotionnel? Imagent un biais de préférence sur la conversation de soutien émotionnel". ACL (2024) [papier]
- ESCOT : "ESCOT: vers des systèmes de dialogue de soutien émotionnel interprétables". ACL (2024) [Paper] [Code]
- Muffin : "Muffin: atténuer inutile dans les conversations de soutien émotionnel avec la rétroaction d'IA multiforme". ACL-Findings (2024) [Paper] [Code]
- DDRCU : "Récupération de démonstration dynamique et compréhension cognitive de la conversation de soutien émotionnel". Sigir (2024) [Paper] [Code]
- KEMI : "Système de dialogue à initiative mixte amélioré la connaissance des conversations de soutien émotionnel". ACL (2023) [Paper] [Code]
- CSCONV : "Un système de dialogue de stimulation cognitive avec fusion de connaissances multi-source pour les anciens souffrant de troubles cognitifs". ACL (2023) [Paper] [Code]
- Auges : "Auges: Augmentation du dialogue avec de grands modèles de langue pour la conversation de soutien émotionnel". Troises du LCA (2023) [papier]
- Transesc : "Transesc: lissage de la conversation de soutien émotionnel via la transition d'état de niveau tournant". ACL-Findings (2023) [Paper] [Code]
- PAL : "PAL: Persona-augmentation de la génération de conversation de soutien émotionnel". ACL-Findings (2023) [Paper] [Code]
- MULTIESC : "Amélioration de la génération de dialogue de soutien émotionnel multi-tour avec la planification de la stratégie de lookahead". EMNLP (2022) [Paper] [Code]
- Misc : "Misc: Un modèle mixte de stratégie intégrant la comète pour une conversation de soutien émotionnel". ACL (2022) [Paper] [Code]
- C3KG : "C3KG: Un graphique de connaissance de la conversation de la commune chinoise". ACL-Findings (2022) [Papier] [Données]
- GLHG : "Contrôle à l'échelle mondiale, comprenez localement: un réseau de graphiques hiérarchiques globaux à local pour la conversation de soutien émotionnel". Ijcai (2022) [papier]
- ESCONV : "Vers des systèmes de dialogue de soutien émotionnel". ACL (2021) [Paper] [Données]
Dialogue empathique
- STOLERCONV : "StickerConv: Génération de réponses empathiques multimodales à partir de zéro". ACL (2024) [Paper] [Données]
- PerceptiveAgent : "Parlez avec des agents humains: dialogue empathique par réception acoustique perceptible et réaction". ACL (2024) [Paper] [Code]
- E-Core : "E-Core: Corrélation émotionnelle Génération d'empathie améliorée" EMNLP (2023) [Paper]
- Empsoa : "Ne vous perdez pas! Génération de réponse empathique via une conscience explicite de soi". ACL-Findings (2023) [Paper] [Code]
- Cas : "Cas: Aligner la cognition et affection grossières pour la génération de réponse empathique". ACL (2023) [Paper] [Code]
- CARE : "CARE: raisonnement de causalité pour les réponses empathiques par génération de graphiques conditionnels". EMNLP-Findings (2022) [Paper] [Code]
- EMPGPT-3 : "Le GPT-3 génère-t-il des dialogues empathiques? Un nouveau méthode de sélection d'exemples dans le contexte et une métrique d'évaluation automatique pour la génération de dialogue empathique". Coling (2022) [papier] [code]
- Posemodial : "Vers les dialogues empathiques multi-tour avec une élicitation d'émotion positive". arXiv (2022) [papier]
- CEM : "CEM: Génération de réponse empathique consciente du bon sens". Aaai (2022) [papier] [code]
- Gee : "La prise de perspective et la pragmatique pour générer des réponses empathiques axées sur les causes des émotions". EMNLP (2021) [Paper] [Code]
- RECEC : "Améliorer la génération d'empathie en reconnaissant la cause de l'émotion dans les conversations". EMNLP-Findings (2021) [Paper] [Code]
- Comae : "Comae: un cadre hiérarchique multi-facteurs pour la génération de réponse empathique". ACL-Findings (2021) [Paper] [Code]
- CARE : "CARE: Génération de réponse émotionnelle consciente de la méconnaissance avec des concepts latents". Aaai (2021) [papier] [code]
- EMPDG : "EMPDG: Génération de dialogue empathique interactive multi-résolution". Coling (2020) [papier] [code]
- MIME : "MIME: imiter les émotions pour la génération de réponse empathique". EMNLP (2020) [Paper] [Code]
- PEC : "Vers des modèles conversationnels empathiques basés sur des personnalités". EMNLP (2020) [Paper] [Code]
- Moel : "Moel: Mélange des auditeurs empathiques". EMNLP (2019) [Paper] [Code]
- EmpatheticDaLoGues : "Vers les modèles de conversation à domaine ouvert empathique: un nouveau référence et un ensemble de données". ACL (2019) [Papier] [Données]
- EMODS : "Générer des réponses avec une émotion spécifique dans le dialogue". ACL (2019) [document]
- Mojitalk : "Mojitalk: générer des réponses émotionnelles à grande échelle". ACL (2018) [papier]
- ECM : "Machine de chat émotionnelle: génération de conversation émotionnelle avec mémoire interne et externe". AAAI (2018) [Papier] [Code]
? Retour en haut
Dialogue de recommandation et CRS
- TCP-Dial : "Suivez-moi: Planification de la conversation pour les systèmes de dialogue de recommandations axés sur la cible". arXiv (2022) [papier] [code]
- KERS : "Kers: un cadre amélioré des connaissances pour les systèmes de dialogue de recommandation avec plusieurs sous-objectifs". EMNLP-Findings (2021) [Paper] [Code]
- DURECDIAL2.0 : "Durecdial 2.0: un corpus parallèle bilingue pour la recommandation conversationnelle". EMNLP (2021) [Paper] [Code]
- DURECDIAL : "Vers la recommandation conversationnelle sur les boîtes de dialogue multi-type". ACL (2020) [Paper] [Code]
- TG-Redial : "Vers le système de recommandation conversationnel guidé par le sujet". Coling (2020) [papier] [code]
- Inspiré : "Inspiré: vers des systèmes de dialogue de recommandations sociables". EMNLP (2020) [Papier] [Données]
- Gorecdial : "Recommandation en tant que jeu de communication: jeu de bot auto-supervisé pour le dialogue axé sur les objectifs". EMNLP (2019) [Paper] [Code]
- CRS-Survey : "Une enquête sur les systèmes de recommandation conversationnelle". Enquêtes informatiques ACM (2021) [papier]
- CRS-Survey : "Progrès et défis dans les systèmes de recommandation conversationnels: une enquête". arXiv (2021) [papier]
- CRSLAB : "CRSLAB: une boîte à outils open source pour construire le système de recommandation conversationnel". arXiv (2021) [papier] [code]
- MESE : "Améliorer la qualité des systèmes de recommandation conversationnelle avec des méta-informations de l'élément contextuel". NAACL (2022) [Paper] [Code]
- C2-CRS : "C2-CRS: Apprentissage contrastif grossier à fin pour le système de recommandation conversationnel". WSDM (2022) [Paper] [Code]
- BotPlay : "Self-Supervised Bot Play for Conversational Recommendation with Justifications". arXiv(2021) [paper]
- RID : "Finetuning Large-Scale Pre-trained Language Models for Conversational Recommendation with Knowledge Graph". arXiv(2021) [paper] [code]
- CRFR : "CRFR: Improving Conversational Recommender Systems via Flexible Fragments Reasoning on Knowledge Graphs". EMNLP(2021) [paper]
- NTRD : "Learning Neural Templates for Recommender Dialogue System". EMNLP(2021) [paper] [code]
- CR-Walker : "CR-Walker: Tree-Structured Graph Reasoning and Dialog Acts for Conversational Recommendation". EMNLP(2021) [paper] [code]
- RevCore : "RevCore: Review-augmented Conversational Recommendation". ACL-Findings(2021) [paper] [code]
- KECRS : "KECRS: Towards Knowledge-Enriched Conversational Recommendation System". arXiv(2021) [paper]
- FPAN : "Adapting User Preference to Online Feedback in Multi-round Conversational Recommendation". WSDM(2021) [paper] [code]
- UNICORN : "Unified Conversational Recommendation Policy Learning via Graph-based Reinforcement Learning". SIGIR(2021) [paper] [code]
- KGSF : "Improving Conversational Recommender Systems via Knowledge Graph based Semantic Fusion". KDD(2020) [paper] [code]
- CPR : "Interactive Path Reasoning on Graph for Conversational Recommendation". KDD(2020) [paper] [code]
- EAR : "Estimation-Action-Reflection: Towards Deep Interaction Between Conversational and Recommender Systems". WSDM(2020) [paper] [code]
- KBRD : "Towards Knowledge-Based Recommender Dialog System". EMNLP(2019) [paper] [code]
- ReDial : "Towards Deep Conversational Recommendations". NeurIPS(2018) [paper] [data]
? Back to Top
Knowledge-grounded Dialogue
- DOCTOR : "Dialogue Chain-of-Thought Distillation for Commonsense-aware Conversational Agents". EMNLP(2023) [paper] [code] [demo]
- GATE : "Well Begun is Half Done: Generator-agnostic Knowledge Pre-Selection for Knowledge-Grounded Dialogue". EMNLP(2023) [paper] [code]
- CONNER : "Beyond Factuality: A Comprehensive Evaluation of Large Language Models as Knowledge Generators". EMNLP(2023) [paper] [code]
- K-DIAL : "Improving Factual Consistency for Knowledge-Grounded Dialogue Systems via Knowledge Enhancement and Alignment". EMNLP-Findings(2023) [paper]
- GLM-Dialog : "GLM-Dialog: Noise-tolerant Pre-training for Knowledge-grounded Dialogue Generation". arXiv(2023) [paper] [code]
- RHO : "RHO (ρ): Reducing Hallucination in Open-domain Dialogues with Knowledge Grounding". ACL-Findings(2023) [paper] [code]
- MultiRefKGC : "There Is No Standard Answer: Knowledge-Grounded Dialogue Generation with Adversarial Activated Multi-Reference Learning". EMNLP(2022) [paper] [code]
- CorefDiffs : "CorefDiffs: Co-referential and Differential Knowledge Flow in Document Grounded Conversations". COLING(2022) [paper] [code]
- DTR : "Stylized Knowledge-Grounded Dialogue Generation via Disentangled Template Rewriting". NAACL(2022) [paper] [code]
- XDAI : "XDAI: A Tuning-free Framework for Exploiting Pre-trained Language Models in Knowledge Grounded Dialogue Generation". KDD(2022) [paper] [code]
- PersonaKGC : "There Are a Thousand Hamlets in a Thousand People's Eyes: Enhancing Knowledge-grounded Dialogue with Personal Memory". ACL(2022) [paper] [code]
- KI : "Lexical Knowledge Internalization for Neural Dialog Generation". ACL(2022) [paper] [code]
- DiffKG : "Towards Large-Scale Interpretable Knowledge Graph Reasoning for Dialogue Systems". ACL-Findings(2022) [paper] [code]
- KSAM : "KSAM: Infusing Multi-Source Knowledge into Dialogue Generation via Knowledge Source Aware Multi-Head Decoding". ACL-Findings(2022) [paper]
- MDSP : "Multi-Stage Prompting for Knowledgeable Dialogue Generation". ACL-Findings(2022) [paper] [code]
- FSB : "Few-Shot Bot: Prompt-Based Learning for Dialogue Systems". arXiv(2021) [paper] [code]
- P-GDG : "Exploring Prompt-based Few-shot Learning for Grounded Dialog Generation". arXiv(2021) [paper]
- KAT-TSLF : "A Three-Stage Learning Framework for Low-Resource Knowledge-Grounded Dialogue Generation". EMNLP(2021) [paper] [code]
- DIALKI : "DIALKI: Knowledge Identification in Conversational Systems through Dialogue-Document Contextualization". EMNLP(2021) [paper] [code]
- CoLV : "CoLV: A Collaborative Latent Variable Model for Knowledge-Grounded Dialogue Generation". EMNLP(2021) [paper]
- SKT-KG : "Augmenting Knowledge-grounded Conversations with Sequential Knowledge Transition". NAACL(2021) [paper]
- MSKE : "More is Better: Enhancing Open-Domain Dialogue Generation via Multi-Source Heterogeneous Knowledge". EMNLP(2021) [paper] [code]
- EARL : "EARL: Informative Knowledge-Grounded Conversation Generation with Entity-Agnostic Representation Learning". EMNLP(2021) [paper] [code]
- KGD-CF : "Increasing Faithfulness in Knowledge-Grounded Dialogue with Controllable Features". ACL(2021) [paper]
- SECE : "Space Efficient Context Encoding for Non-Task-Oriented Dialogue Generation with Graph Attention Transformer". ACL(2021) [paper] [code]
- MIKe : "Initiative-Aware Self-Supervised Learning for Knowledge-Grounded Conversations". SIGIR(2021) [paper] [code]
- GOKC : "Learning to Copy Coherent Knowledge for Response Generation". AAAI(2021) [paper] [code]
- KnowledGPT : "Knowledge-Grounded Dialogue Generation with Pre-trained Language Models". EMNLP(2020) [paper] [code]
- DiffKS : "Difference-aware Knowledge Selection for Knowledge-grounded Conversation Generation". EMNLP-Findings(2020) [paper] [code]
- DukeNet : "DukeNet: A Dual Knowledge Interaction Network for Knowledge-Grounded Conversation". SIGIR(2020) [paper] [code]
- CCN : "Cross Copy Network for Dialogue Generation". EMNLP(2020) [paper] [code]
- PIPM : "Bridging the Gap between Prior and Posterior Knowledge Selection for Knowledge-Grounded Dialogue Generation". EMNLP(2020) [paper]
- ConceptFlow : "Grounded Conversation Generation as Guided Traverses in Commonsense Knowledge Graphs". ACL(2020) [paper] [code]
- ConKADI : "Diverse and Informative Dialogue Generation with Context-Specific Commonsense Knowledge Awareness". ACL(2020) [paper] [code]
- KIC : "Generating Informative Conversational Response using Recurrent Knowledge-Interaction and Knowledge-Copy". ACL(2020) [paper]
- SKT : "Sequential Latent Knowledge Selection for Knowledge-Grounded Dialogue". ICLR(2020) [paper] [code]
- KdConv : "KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn Knowledge-driven Conversation". ACL(2020) [paper] [data]
- TransDG : "Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering". AAAI(2020) [paper] [code]
- RefNet : "RefNet: A Reference-aware Network for Background Based Conversation". AAAI(2020) [paper] [code]
- GLKS : "Thinking Globally, Acting Locally: Distantly Supervised Global-to-Local Knowledge Selection for Background Based Conversation". AAAI(2020) [paper] [code]
- AKGCM : "Knowledge Aware Conversation Generation with Explainable Reasoning over Augmented Graphs". EMNLP(2019) [paper] [code]
- DyKgChat : "DyKgChat: Benchmarking Dialogue Generation Grounding on Dynamic Knowledge Graphs". EMNLP(2019) [paper] [code]
- OpenDialKG : "OpenDialKG: Explainable Conversational Reasoning with Attention-based Walks over Knowledge Graphs". ACL(2019) [paper] [data]
- WoW : "Wizard of Wikipedia: Knowledge-Powered Conversational agents". ICLR(2019) [paper]
- PostKS : "Learning to Select Knowledge for Response Generation in Dialog Systems". IJCAI(2019) [paper] [code-1] [code-2]
- NKD : "Knowledge Diffusion for Neural Dialogue Generation". ACL(2018) [paper] [data]
- Dual Fusion : "Smarter Response with Proactive Suggestion: A New Generative Neural Conversation Paradigm". IJCAI(2018) [paper]
- CCM : "Commonsense Knowledge Aware Conversation Generation with Graph Attention". IJCAI(2018) [paper] [code-tf] [code-py]
- MTask : "A Knowledge-Grounded Neural Conversation Model". AAAI(2018) [paper]
- GenDS : "Flexible End-to-End Dialogue System for Knowledge Grounded Conversation". arXiv(2017) [paper]
? Back to Top
Task-oriented Dialogue
- P-ToD : "Personalizing Task-oriented Dialog Systems via Zero-shot Generalizable Reward Function". CIKM(2022) [paper]
- Dialogic : "Dialogic: Controllable Dialogue Simulation with In-Context Learning". EMNLP-Findings(2022) [paper] [code]
- KB-Adapter : "Injecting Domain Knowledge in Language Models for Task-Oriented Dialogue Systems". EMNLP(2022) [paper] [code]
- TacoBot : "Bootstrapping a User-Centered Task-Oriented Dialogue System". Proceedings of Alexa Prize TaskBot(2021) [paper]
- USDA : "User Satisfaction Estimation with Sequential Dialogue Act Modeling in Goal-oriented Conversational Systems". WWW(2022) [paper] [code]
- USS : "Simulating User Satisfaction for the Evaluation of Task-oriented Dialogue Systems". SIGIR(2021) [paper] [data]
- NS-Dial : "An Interpretable Neuro-Symbolic Reasoning Framework for Task-Oriented Dialogue Generation". ACL(2022) [paper] [code]
- GALAXY : "GALAXY: A Generative Pre-trained Model for Task-Oriented Dialog with Semi-Supervised Learning and Explicit Policy Injection". AAAI(2022) [paper] [code]
- PPTOD : "Multi-Task Pre-Training for Plug-and-Play Task-Oriented Dialogue System". arXiv(2021) [paper] [code]
- ToDCL : "Continual Learning in Task-Oriented Dialogue Systems". EMNLP(2021) [paper] [code]
- IR-Net : "Intention Reasoning Network for Multi-Domain End-to-end Task-Oriented Dialogue". EMNLP(2021) [paper]
- HyKnow : "HyKnow: End-to-End Task-Oriented Dialog Modeling with Hybrid Knowledge Management". ACL-Findings(2021) [paper] [code]
- DDMN : "Dual Dynamic Memory Network for End-to-End Multi-turn Task-oriented Dialog Systems". COLING(2020) [paper] [code]
- ToD-BERT : "ToD-BERT: Pre-trained Natural Language Understanding for Task-Oriented Dialogues". EMNLP(2020) [paper] [code]
- GraphDialog : "GraphDialog: Integrating Graph Knowledge into End-to-End Task-Oriented Dialogue Systems". EMNLP(2020) [paper] [code]
- MARCO : "Multi-Domain Dialogue Acts and Response Co-Generation". ACL(2020) [paper] [code]
- DF-Net : "Dynamic Fusion Network for Multi-Domain End-to-end Task-Oriented Dialog". ACL(2020) [paper] [code]
- MALA : "MALA: Cross-Domain Dialogue Generation with Action Learning". AAAI(2020) [paper]
- SGD : "Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset". AAAI(2020) [paper] [data]
- CrossWOZ : "CrossWOZ: A Large-Scale Chinese Cross-Domain Task-Oriented Dialogue Dataset". TACL(2020) [paper] [code]
- MultiWOZ : "MultiWOZ - A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling". EMNLP(2018) [paper] [code]
- Neural Task-Oriented Dialogue : "Learning to Memorize in Neural Task-Oriented Dialogue Systems". MPhil Thesis(2019) [paper]
- GLMP : "Global-to-local Memory Pointer Networks for Task-Oriented Dialogue". ICLR(2019) [paper] [code]
- KB Retriever : "Entity-Consistent End-to-end Task-Oriented Dialogue System with KB Retriever". EMNLP(2019) [paper] [data]
- TRADE : "Transferable Multi-Domain State Generator for Task-Oriented Dialogue Systems". ACL(2019) [paper] [code]
- WMM2Seq : "A Working Memory Model for Task-oriented Dialog Response Generation". ACL(2019) [paper]
- Pretrain-Fine-tune : "Training Neural Response Selection for Task-Oriented Dialogue Systems". ACL(2019) [paper] [data]
- Multi-level Mem : "Multi-Level Memory for Task Oriented Dialogs". NAACL(2019) [paper] [code]
- BossNet : "Disentangling Language and Knowledge in Task-Oriented Dialogs ". NAACL(2019) [paper] [code]
- SDN : "Subgoal Discovery for Hierarchical Dialogue Policy Learning". EMNLP(2018) [paper]
- D3Q : "Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning". EMNLP(2018) [paper] [code]
- DDQ : "Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning". ACL(2018) [paper] [code]
- MAD : "Memory-augmented Dialogue Management for Task-oriented Dialogue Systems". TOIS(2018) [paper]
- TSCP : "Sequicity: Simplifying Task-oriented Dialogue Systems with Single Sequence-to-Sequence Architectures". ACL(2018) [paper] [code]
- Mem2Seq : "Mem2Seq: Effectively Incorporating Knowledge Bases into End-to-End Task-Oriented Dialog Systems". ACL(2018) [paper] [code]
- Topic-Seg-Label : "A Weakly Supervised Method for Topic Segmentation and Labeling in Goal-oriented Dialogues via Reinforcement Learning". IJCAI(2018) [paper] [code]
- AliMe : "AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine". ACL(2017) [paper]
- KVR Net : "Key-Value Retrieval Networks for Task-Oriented Dialogue". SIGDIAL(2017) [paper] [data]
? Back to Top
Open-domain Dialogue
Long-term Dialogue
- THEANINE : "THEANINE: Revisiting Memory Management in Long-term Conversations with Timeline-augmented Response Generation". arXiv(2024) [paper]
- LD-Agent : "Hello Again! LLM-powered Personalized Agent for Long-term Dialogue". arXiv(2024) [paper] [code]
- CPD : "Position Debiasing Fine-Tuning for Causal Perception in Long-Term Dialogue". IJCAI(2024) [paper]
- TemporalMemory : "Toward Conversational Agents with Context and Time Sensitive Long-term Memory". arXiv(2024) [paper] [data]
- LoCoMo : "Evaluating Very Long-Term Conversational Memory of LLM Agents". ACL(2024) [paper] [data]
- Conversation Chronicles : "Conversation Chronicles: Towards Diverse Temporal and Relational Dynamics in Multi-Session Conversations". EMNLP(2023) [paper] [data]
- GapChat : "Mind the Gap Between Conversations for Improved Long-Term Dialogue Generation". EMNLP-Findings(2023) [paper] [data]
- UniMC : "UniMC: A Unified Framework for Long-Term Memory Conversation via Relevance Representation Learning". arXiv(2023) [paper]
- RS : "Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models". arXiv(2023) [paper]
- MSC : "Beyond Goldfish Memory: Long-Term Open-Domain Conversation". ACL(2022) [paper] [data]
Response Generation
- Overview : "Open-domain Dialogue Generation: What We Can Do, Cannot Do, And Should Do Next". ACL-NLP4ConvAI(2022) [paper]
- Chirpy Cardinal : "Neural Generation Meets Real People: Building a Social, Informative Open-Domain Dialogue Agent". SIGDIAL(2022) [paper] [code] [project]
- TIL : "Towards Efficient Dialogue Pre-training with Transferable and Interpretable Latent Structure". EMNLP(2022) [paper]
- ProphetChat : "ProphetChat: Enhancing Dialogue Generation with Simulation of Future Conversation". ACL(2022) [paper]
- DialoFlow : "Conversations Are Not Flat: Modeling the Dynamic Information Flow across Dialogue Utterances". ACL(2021) [paper] [code]
- DiSCoL : "DiSCoL: Toward Engaging Dialogue Systems through Conversational Line Guided Response Generation". NAACL(2021) [paper] [code]
- DialogBERT : "DialogBERT: Discourse-Aware Response Generation via Learning to Recover and Rank Utterances". AAAI(2021) [paper]
- BlenderBot : "Recipes for Building an Open-Domain Chatbot". EACL(2021) [paper] [code]
- CDial-GPT : "A Large-Scale Chinese Short-Text Conversation Dataset". NLPCC(2020) [paper] [code]
- DialoGPT : "DialoGPT : Large-Scale Generative Pre-training for Conversational Response Generation". ACL(2020) [paper] [code]
- CG-Policy : "Conversational Graph Grounded Policy Learning for Open-Domain Conversation Generation". ACL(2020) [paper]
- PLATO-XL : "PLATO-XL: Exploring the Large-scale Pre-training of Dialogue Generation". arXiv(2021) [paper] [code]
- PLATO-2 : "PLATO-2: Towards Building an Open-Domain Chatbot via Curriculum Learning". ACL-Findings(2021) [paper] [code]
- PLATO : "PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable". ACL(2020) [paper] [code]
- Guyu : "An Empirical Investigation of Pre-Trained Transformer Language Models for Open-Domain Dialogue Generation". arXiv(2020) [paper] [code]
- CL4Dialogue : "Group-wise Contrastive Learning for Neural Dialogue Generation". EMNLP-Findings(2020) [paper] [code]
- Neg-train : "Negative Training for Neural Dialogue Response Generation". ACL(2020) [paper] [code]
- HDSA : "Semantically Conditioned Dialog Response Generation via Hierarchical Disentangled Self-Attention". ACL(2019) [paper] [code]
- CAS : "Skeleton-to-Response: Dialogue Generation Guided by Retrieval Memory". NAACL(2019) [paper] [code]
- Edit-N-Rerank : "Response Generation by Context-aware Prototype Editing". AAAI(2019) [paper] [code]
- HVMN : "Hierarchical Variational Memory Network for Dialogue Generation". WWW(2018) [paper] [code]
- XiaoIce : "The Design and Implementation of XiaoIce, an Empathetic Social Chatbot". arXiv(2018) [paper]
- D2A : "Dialog-to-Action: Conversational Question Answering Over a Large-Scale Knowledge Base". NeurIPS(2018) [paper] [code]
- DAIM : "Generating Informative and Diverse Conversational Responses via Adversarial Information Maximization". NeurIPS(2018) [paper]
- REASON : "Dialog Generation Using Multi-turn Reasoning Neural Networks". NAACL(2018) [paper]
- STD/HTD : "Learning to Ask Questions in Open-domain Conversational Systems with Typed Decoders". ACL(2018) [paper] [code]
- CSF : "Generating Informative Responses with Controlled Sentence Function". ACL(2018) [paper] [code]
- DAWnet : "Chat More: Deepening and Widening the Chatting Topic via A Deep Model". SIGIR(2018) [paper] [code]
- ZSDG : "Zero-Shot Dialog Generation with Cross-Domain Latent Actions". SIGDIAL(2018) [paper] [code]
- DUA : "Modeling Multi-turn Conversation with Deep Utterance Aggregation". COLING(2018) [paper] [code]
- Data-Aug : "Sequence-to-Sequence Data Augmentation for Dialogue Language Understanding". COLING(2018) [paper] [code]
- DC-MMI : "Generating More Interesting Responses in Neural Conversation Models with Distributional Constraints". EMNLP(2018) [paper] [code]
- cVAE-XGate/CGate : "Better Conversations by Modeling, Filtering, and Optimizing for Coherence and Diversity". EMNLP(2018) [paper] [code]
- Retrieval+multi-seq2seq : "An Ensemble of Retrieval-Based and Generation-Based Human-Computer Conversation Systems". IJCAI(2018) [paper]
- DAM : "Multi-Turn Response Selection for Chatbots with Deep Attention Matching Network". ACL(2018) [paper] [code]
- SMN : "Sequential Matching Network: A New Architecture for Multi-turn Response Selection in Retrieval-Based Chatbots". ACL(2017) [paper] [code]
- CVAE/KgCVAE : "Learning Discourse-level Diversity for Neural Dialog Models using Conditional Variational Autoencoders". ACL(2017) [paper] [code]
- TA-Seq2Seq : "Topic Aware Neural Response Generation". AAAI(2017) [paper] [code]
- MA : "Mechanism-Aware Neural Machine for Dialogue Response Generation". AAAI(2017) [paper]
- VHRED : "A Hierarchical Latent Variable Encoder-Decoder Model for Generating Dialogues". AAAI(2017) [paper] [code]
- HRED : "Building End-To-End Dialogue Systems Using Generative Hierarchical Neural Network Models". AAAI(2016) [paper] [code]
- RL-Dialogue : "Deep Reinforcement Learning for Dialogue Generation". EMNLP(2016) [paper]
- MMI : "A Diversity-Promoting Objective Function for Neural Conversation Models". NAACL(2016) [paper] [code]
? Back to Top
Dialogue Evaluation
- DialogBench : "DialogBench: Evaluating LLMs as Human-like Dialogue Systems". NAACL(2024) [paper] [code]
- ChatEval : "ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate". arXiv(2023) [paper] [code]
- ACCENT : "ACCENT: An Automatic Event Commonsense Evaluation Metric for Open-Domain Dialogue Systems". ACL(2023) [paper] [code]
- LLMEval : "Understanding the Effectiveness of Very Large Language Models on Dialog Evaluation". IWSDS(2023) [paper]
- ChatEvalPlatform : "Don't Forget Your ABC's: Evaluating the State-of-the-Art in Chat-Oriented Dialogue Systems". arXiv(2022) [paper] [code]
- MDD-Eval : "MDD-Eval: Self-Training on Augmented Data for Multi-Domain Dialogue Evaluation". AAAI(2022) [paper] [code]
- Self-Eval : "SelF-Eval: Self-supervised Fine-grained Dialogue Evaluation". COLING(2022) [paper] [code]
- FineD-Eval : "FineD-Eval: Fine-grained Automatic Dialogue-Level Evaluation". EMNLP(2022) [paper] [code]
- FlowEval : "FlowEval: A Consensus-Based Dialogue Evaluation Framework Using Segment Act Flows". EMNLP(2022) [paper]
- IM2 : "IM^2: an Interpretable and Multi-category Integrated Metric Framework for Automatic Dialogue Evaluation". EMNLP(2022) [paper] [code]
- Q^2 : "$Q^{2}$: Evaluating Factual Consistency in Knowledge-Grounded Dialogues via Question Generation and Question Answering". EMNLP(2021) [paper] [code]
- QuantiDCE : "Towards Quantifiable Dialogue Coherence Evaluation". ACL(2021) [paper] [code]
- DynaEval : "DynaEval: Unifying Turn and Dialogue Level Evaluation". ACL(2021) [paper] [code]
- Review : "How to Evaluate Your Dialogue Models: A Review of Approaches". arXiv(2021) [paper]
- ConvLabEval : "Is Your Goal-Oriented Dialog Model Performing Really Well? Empirical Analysis of System-wise Evaluation". SIGDIAL(2020) [paper]
- FED : "Unsupervised Evaluation of Interactive Dialog with DialoGPT". SIGDIAL(2020) [paper] [code] [data]
- Spot-the-Bot : "Spot The Bot: A Robust and Efficient Framework for the Evaluation of Conversational Dialogue Systems". EMNLP(2020) [paper] [code]
- CMADE : "Beyond User Self-Reported Likert Scale Ratings: A Comparison Model for Automatic Dialog Evaluation". ACL(2020) [paper] [code]
- Coherence : "Dialogue Coherence Assessment Without Explicit Dialogue Act Labels". ACL(2020) [paper] [code]
- MAUDE : "Learning an Unreferenced Metric for Online Dialogue Evaluation". ACL(2020) [paper] [code]
- GRADE : "GRADE: Automatic Graph-Enhanced Coherence Metric for Evaluating Open-Domain Dialogue Systems". ACL(2020) [paper] [code]
- uBLEU : "uBLEU: Uncertainty-Aware Automatic Evaluation Method for Open-Domain Dialogue Systems". ACL(2020) [paper] [code]
- USR : "USR: An Unsupervised and Reference Free Evaluation Metric for Dialog Generation". ACL(2020) [paper] [code]
- ACUTE-EVAL : "ACUTE-EVAL: Improved Dialogue Evaluation with Optimized Questions and Multi-turn Comparisons". NIPS ConvAI Workshop(2019) [paper] [code]
- InteractiveEval : "Approximating Interactive Human Evaluation with Self-Play for Open-Domain Dialog Systems". NeurIPS(2019) [paper] [code]
- ChatEval : "ChatEval: A Tool for Chatbot Evaluation". NAACL(2019) [paper] [project]
- ADVMT : "One
Ruler for All Languages: Multi-Lingual Dialogue Evaluation with Adversarial Multi-Task Learning". IJCAI(2018) [paper]
? Back to Top
Dialogue Misc.
- Signed-dialogue : "Generating Signed Language Instructions in Large-Scale Dialogue Systems". NAACL(2024) [paper] [data]
- Dialogue-KT : "Exploring Knowledge Tracing in Tutor-Student Dialogues". arXiv(2024) [paper] [code]
- MathDial : "MathDial: A Dialogue Tutoring Dataset with Rich Pedagogical Properties Grounded in Math Reasoning Problems". EMNLP-Findings(2023) [paper] [data]
- EduChat : "EduChat: A Large-Scale Language Model-based Chatbot System for Intelligent Education". arXiv(2023) [paper] [code]
- ACT : "Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training". arXiv(2024) [paper]
- ReviewMT : "Peer Review as A Multi-Turn and Long-Context Dialogue with Role-Based Interactions". arXiv(2024) [paper] [code]
- WildChat : "WildChat: 1M ChatGPT Interaction Logs in the Wild". ICLR(2024) [paper] [data]
- DialOp : "Decision-Oriented Dialogue for Human-AI Collaboration". arXiv(2023) [paper] [code]
- DialogStudio : "DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection for Conversational AI". arXiv(2023) [paper] [code]
- MPC : "Multi-Party Chat: Conversational Agents in Group Settings with Humans and Models". arXiv(2023) [paper] [code]
- SODA : "SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization". EMNLP(2023) [paper] [code]
- speaker-adaptation : "Speaking the Language of Your Listener: Audience-Aware Adaptation via Plug-and-Play Theory of Mind". ACL-Findings(2023) [paper] [code]
- SocialDial : "SocialDial: A Benchmark for Socially-Aware Dialogue Systems". SIGIR(2023) [paper] [data]
- BotsTalk : "BotsTalk: Machine-sourced Framework for Automatic Curation of Large-scale Multi-skill Dialogue Datasets". EMNLP(2022) [paper] [code]
- Dialogic : "Dialogic: Controllable Dialogue Simulation with In-Context Learning". EMNLP-Findings(2022) [paper] [code]
- ProsocialDialog : "ProsocialDialog: A Prosocial Backbone for Conversational Agents". EMNLP(2022) [paper] [code]
- MIC : "The Moral Integrity Corpus: A Benchmark for Ethical Dialogue Systems". ACL(2022) [paper] [code]
- MoralDial : "MoralDial: A Framework to Train and Evaluate Moral Dialogue Systems via Constructing Moral Discussions". arXiv(2022) [paper]
- DECODE : "I like fish, especially dolphins: Addressing Contradictions in Dialogue Modeling". ACL(2021) [paper] [code]
? Back to Top
Natural Language Generation
Survey on NLG
- CTG : "A Survey of Controllable Text Generation using Transformer-based Pre-trained Language Models". arXiv(2022) [paper]
- RTG : "A Survey on Retrieval-Augmented Text Generation". arXiv(2022) [paper]
- Hallucination : "Survey of Hallucination in Natural Language Generation". arXiv(2022) [paper]
- Evaluation : "A Survey of Evaluation Metrics Used for NLG Systems". arXiv(2020) [paper]
? Back to Top
NLG Theories and Techniques
- RED : "Decoder-Only or Encoder-Decoder? Interpreting Language Model as a Regularized Encoder-Decoder". arXiv(2023) [paper]
- LaMemo : "LaMemo: Language Modeling with Look-Ahead Memory". NAACL(2022) [paper] [code]
- PTG : "Learning to Transfer Prompts for Text Generation". NAACL(2022) [paper] [code]
- EISL : "Don't Take It Literally: An Edit-Invariant Sequence Loss for Text Generation". NAACL(2022) [paper] [code]
- CT-Loss : "A Simple Contrastive Learning Objective for Alleviating Neural Text Degeneration". arXiv(2022) [paper] [code]
- SimCTG : "A Contrastive Framework for Neural Text Generation". NeurIPS(2022) [paper] [code]
- CoNT : "CoNT: Contrastive Neural Text Generation". NeurIPS(2022) [paper] [code]
- Two-level-CL : "Keywords and Instances: A Hierarchical Contrastive Learning Framework Unifying Hybrid Granularities for Text Generation". ACL(2022) [paper]
- CLAPS : "Contrastive Learning with Adversarial Perturbations for Conditional Text Generation". ICLR(2021) [paper] [code]
- RetGen : "RetGen: A Joint framework for Retrieval and Grounded Text Generation Modeling". AAAI(2022) [paper] [code]
- RAG : "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks". NeurIPS(2020) [paper] [code]
- TextGAIL : "TextGAIL: Generative Adversarial Imitation Learning for Text Generation". AAAI(2021) [paper] [code]
- Latent-GLAT : " latent -GLAT: Glancing at Latent Variables for Parallel Text Generation". ACL(2022) [paper] [code]
- s2s-ft : "s2s-ft: Fine-Tuning Pretrained Transformer Encoders for Sequence-to-Sequence Learning". arXiv(2021) [paper] [code]
- EBM : "Exposure Bias versus Self-Recovery: Are Distortions Really Incremental for Autoregressive Text Generation?". EMNLP(2021) [paper]
- DiscoDVT : "DiscoDVT: Generating Long Text with Discourse-Aware Discrete Variational Transformer". EMNLP(2021) [paper] [code]
- DATG : "Data Augmentation for Text Generation Without Any Augmented Data". ACL(2021) [paper]
- JointGT : "JointGT: Graph-Text Joint Representation Learning for Text Generation from Knowledge Graphs". ACL-Findings(2021) [paper] [code]
- Embedding-Transfer : "Bridging Subword Gaps in Pretrain-Finetune Paradigm for Natural Language Generation". ACL(2021) [paper] [code]
- FastSeq : "EL-Attention: Memory Efficient Lossless Attention for Generation". ICML(2021) [paper] [code]
- BERTSeq2Seq : "Leveraging Pre-trained Checkpoints for Sequence Generation Tasks". TACL(2020) [paper] [code-tf] [code-py]
- ERNIE-GEN : "ERNIE-GEN: An Enhanced Multi-Flow Pre-training and Fine-tuning Framework for Natural Language Generation". IJCAI(2020) [paper] [code]
- DITTO : "Learning to Break the Loop: Analyzing and Mitigating Repetitions for Neural Text Generation". NeurIPS(2022) [paper] [code]
- Repetition-Problem : "A Theoretical Analysis of the Repetition Problem in Text Generation". AAAI(2021) [paper] [code]
- ENCONTER : "ENCONTER: Entity Constrained Progressive Sequence Generation via Insertion-based Transformer". EACL(2021) [paper] [code]
- POINTER : "POINTER: Constrained Progressive Text Generation via Insertion-based Generative Pre-training". EMNLP(2020) [paper] [code]
- Cascaded Generation : "Cascaded Text Generation with Markov Transformers". NeurIPS(2020) [paper] [code]
- SFOT : "Improving Text Generation with Student-Forcing Optimal Transport". EMNLP(2020) [paper]
- OT-Seq2Seq : "Improving Sequence-to-Sequence Learning via Optimal Transport". ICLR(2019) [paper] [code]
? Back to Top
Diffusion Models for NLG
- RenderDiffusion : "RenderDiffusion: Text Generation as Image Generation". arXiv(2023) [paper]
- Masked-Diffusion-LM : "A Cheaper and Better Diffusion Language Model with Soft-Masked Noise". arXiv(2023) [paper] [code]
- discrete-diffusion : "A Reparameterized Discrete Diffusion Model for Text Generation". arXiv(2023) [paper] [code]
- Difformer : "Difformer: Empowering Diffusion Models on the Embedding Space for Text Generation". arXiv(2023) [paper]
- GENIE : "Text Generation with Diffusion Language Models: A Pre-training Approach with Continuous Paragraph Denoise". arXiv(2022) [paper] [code]
- SED : "Self-conditioned Embedding Diffusion for Text Generation". arXiv(2022) [paper]
- SSD-LM : "SSD-LM: Semi-autoregressive Simplex-based Diffusion Language Model for Text Generation and Modular Control". arXiv(2022) [paper] [code]
- LD4LG : "Latent Diffusion for Language Generation". arXiv(2022) [paper] [code]
- DiffusionBERT : "DiffusionBERT: Improving Generative Masked Language Models with Diffusion Models". arXiv(2022) [paper] [code]
- DiffusER : "DiffusER: Discrete Diffusion via Edit-based Reconstruction". arXiv(2022) [paper] [code]
- SeqDiffuSeq : "SeqDiffuSeq: Text Diffusion with Encoder-Decoder Transformers". arXiv(2022) [paper] [code]
- DiffuSeq : "DiffuSeq: Sequence to Sequence Text Generation with Diffusion Models". ICLR(2023) [paper] [code]
- Diffusion-LM : "Diffusion-LM Improves Controllable Text Generation". NeurIPS(2022) [paper] [code]
- D3PM : "Structured Denoising Diffusion Models in Discrete State-Spaces". NeurIPS(2021) [paper] [code]
? Back to Top
Controllable Generation
- ConGenBench : "Controllable Text Generation in the Instruction-Tuning Era". arXiv(2024) [paper] [code]
- GeLaTo : "Tractable Control for Autoregressive Language Generation". arXiv(2023) [paper]
- Cognac : "Controllable Text Generation with Language Constraints". arXiv(2022) [paper] [code]
- CriticControl : "Critic-Guided Decoding for Controlled Text Generation". arXiv(2022) [paper]
- LatentOps : "Composable Text Controls in Latent Space with ODEs". arXiv(2022) [paper] [code]
- FAST : "FAST: Improving Controllability for Text Generation with Feedback Aware Self-Training". arXiv(2022) [paper]
- DisCup : "DisCup: Discriminator Cooperative Unlikelihood Prompt-tuning for Controllable Text Generation". EMNLP(2022) [paper] [code]
- MultiControl : "A Distributional Lens for Multi-Aspect Controllable Text Generation". EMNLP(2022) [paper] [code]
- NADO : "Controllable Text Generation with Neurally-Decomposed Oracle". NeurIPS(2022) [paper] [code]
- Mix-Match : "Mix and Match: Learning-free Controllable Text Generation using Energy Language Models". ACL(2022) [paper] [code]
- ControlPrefix : "Controllable Natural Language Generation with Contrastive Prefixes". ACL-Findings(2022) [paper]
- MUCOCO : "Controlled Text Generation as Continuous Optimization with Multiple Constraints". NeurIPS(2021) [paper] [code]
- DExperts : "DExperts: Decoding-Time Controlled Text Generation with Experts and Anti-Experts". ACL(2021) [paper] [code]
- FUDGE : "FUDGE: Controlled Text Generation With Future Discriminators". NAACL(2021) [paper] [code]
- GeDi : "GeDi: Generative Discriminator Guided Sequence Generation". EMNLP-Findings(2021) [paper] [code]
- GDC : "A Distributional Approach to Controlled Text Generation". ICLR(2021) [paper] [code]
- CoCon : "CoCon: A Self-Supervised Approach for Controlled Text Generation". ICLR(2021) [paper] [code]
- PPLM : "Plug and Play Language Models: A Simple Approach to Controlled Text Generation". ICLR(2020) [paper] [code]
- CTRL : "CTRL: A Conditional Transformer Language Model for Controllable Generation". arXiv(2019) [paper] [code]
? Back to Top
Text Planning
- CoScript : "Distilling Script Knowledge from Large Language Models for Constrained Language Planning". ACL(2023) [paper] [code]
- RSTGen : "RSTGen: Imbuing Fine-Grained Interpretable Control into Long-FormText Generators". NAACL(2022) [paper]
- Time Control : "Language Modeling via Stochastic Processes". ICLR(2022) [paper] [code]
- PLANET : "PLANET: Dynamic Content Planning in Autoregressive Transformers for Long-form Text Generation". ACL(2022) [paper]
- EventPlan : "Event Transition Planning for Open-ended Text Generation". ACL-Findings(2022) [paper] [code]
- CETP : "Knowledge-based Review Generation by Coherence Enhanced Text Planning". SIGIR(2021) [paper]
- PlanGen : "Plan-then-Generate: Controlled Data-to-Text Generation via Planning". EMNLP-Findings(2021) [paper] [code]
- DYPLOC : "DYPLOC: Dynamic Planning of Content Using Mixed Language Models for Text Generation". ACL(2021) [paper] [code]
- Tree-PLAN : "Infobox-to-text Generation with Tree-like Planning based Attention Network". IJCAI(2020) [paper]
- ProphetNet : "ProphetNet: Predicting Future N-gram for Sequence-to-Sequence Pre-training". EMNLP-Findings(2020) [paper] [code]
- PAIR : "PAIR: Planning and Iterative Refinement in Pre-trained Transformers for Long Text Generation". EMNLP(2020) [paper] [code]
- SentPlan : "Sentence-Level Content Planning and Style Specification for Neural Text Generation". EMNLP(2019) [paper] [code]
- PHVM : "Long and Diverse Text Generation with Planning-based Hierarchical Variational Model". EMNLP(2019) [paper] [code]
- TwinNet : "Twin Networks: Matching the Future for Sequence Generation". ICLR(2018) [paper] [code]
- PAG : "Plan, Attend, Generate: Planning for Sequence-to-Sequence Models". NIPS(2017) [paper]
? Back to Top
Decoding Algorithms
- Speculative Decoding : "Speculative Decoding: Exploiting Speculative Execution for Accelerating Seq2seq Generation". EMNLP-Findings(2023) [paper] [code]
- Medusa : "Medusa: Simple Framework for Accelerating LLM Generation with Multiple Decoding Heads". Github(2023) [Blog] [code]
- Lookahead Decoding : "Breaking the Sequential Dependency of LLM Inference Using Lookahead Decoding". LMSYS Org(2023) [Blog] [code]
- Speculative Sampling : "Accelerating Large Language Model Decoding with Speculative Sampling". arXiv(2023) [paper]
- Speculative Decoding : "Fast Inference from Transformers via Speculative Decoding". ICML(2023) [paper] [code]
- Parallel Decoding : "Accelerating Transformer Inference for Translation via Parallel Decoding". ACL(2023) [paper] [code]
- EAD : "The Stable Entropy Hypothesis and Entropy-Aware Decoding: An Analysis and Algorithm for Robust Natural Language Generation". arXiv(2023) [paper] [code]
- Contrastive Search : "Contrastive Search Is What You Need For Neural Text Generation". TMLR(2023) [paper] [code] [blog]
- Momentum Decoding : "Momentum Decoding: Open-ended Text Generation As Graph Exploration". arXiv(2022) [paper] [code]
- Crowd Sampling : "Follow the Wisdom of the Crowd: Effective Text Generation via Minimum Bayes Risk Decoding". arXiv(2022) [paper] [code]
- RankGen : "RankGen: Improving Text Generation with Large Ranking Models". EMNLP(2022) [paper] [code]
- Contrastive Decoding : "Contrastive Decoding: Open-ended Text Generation as Optimization". arXiv(2022) [paper] [code]
- COLD : "COLD Decoding: Energy-based Constrained Text Generation with Langevin Dynamics". NeurIPS(2022) [paper] [code]
- Lattice : "Massive-scale Decoding for Text Generation using Lattices". NAACL(2022) [paper] [code]
- KID : "Knowledge Infused Decoding". ICLR(2022) [paper] [code]
- NeuroLogic A*esque : "NeuroLogic A *esque Decoding: Constrained Text Generation with Lookahead Heuristics". NAACL(2022) [paper] [code]
- NeuroLogic : "NeuroLogic Decoding: (Un)supervised Neural Text Generation with Predicate Logic Constraints". NAACL(2021) [paper] [code]
- DeLorean : "Back to the Future: Unsupervised Backprop-based Decoding for Counterfactual and Abductive Commonsense Reasoning". EMNLP(2020) [paper] [code]
- Top-p (Nucleus) Sampling : "The Curious Case of Neural Text Degeneration". ICLR(2020) [paper] [code]
- BP Decoding : "Blockwise Parallel Decoding for Deep Autoregressive Models". NIPS(2018) [paper]
- Disjunctive Constraints : "Guided Generation of Cause and Effect". IJCAI(2020) [paper] [code-huggingface]
- CGMH : "CGMH: Constrained Sentence Generation by Metropolis-Hastings Sampling". AAAI(2019) [paper] [code]
- DBS : "Directed Beam Search: Plug-and-Play Lexically Constrained Language Generation". arXiv(2020) [paper] [code]
- DBA : "Fast Lexically Constrained Decoding with Dynamic Beam Allocation for Neural Machine Translation". NAACL(2018) [paper] [code-official] [code-fairseq]
- GBS : "Lexically Constrained Decoding for Sequence Generation Using Grid Beam Search". ACL(2017) [paper] [code]
? Back to Top
NLG Evaluation
- Survey : "Leveraging Large Language Models for NLG Evaluation: A Survey". arXiv(2024) [paper]
- BBScore : "BBScore: A Brownian Bridge Based Metric for Assessing Text Coherence". AAAI(2024) [paper]
- GPTEval : "GPTEval: NLG Evaluation using GPT-4 with Better Human Alignment". arXiv(2023) [paper]
- GPTScore : "GPTScore: Evaluate as You Desire". arXiv(2023) [paper] [code]
- RoMe : "RoMe: A Robust Metric for Evaluating Natural Language Generation". ACL(2022) [paper] [code]
- EAD : "Rethinking and Refining the Distinct Metric". ACL(2022) [paper] [code]
- MID : "Mutual Information Divergence: A Unified Metric for Multimodal Generative Models". NeurIPS(2022) [paper]
- DiscoScore : "DiscoScore: Evaluating Text Generation with BERT and Discourse Coherence". arXiv(2022) [paper] [code]
- CTC-Score : "Compression, Transduction, and Creation: A Unified Framework for Evaluating Natural Language Generation". EMNLP(2021) [paper] [code]
- BLEURT : "BLEURT: Learning Robust Metrics for Text Generation". ACL(2020) [paper] [code]
? Back to Top