Leitura de papel-Convai
Lista de leitura em papel na IA conversacional, principalmente os sistemas de diálogo e a geração de linguagem natural . Este repositório está atualizando constantemente? ...
- Aprendizagem profunda na PNL
- Sistemas de diálogo
- Pesquisa sobre diálogo
- Conversational LLMS
- Diálogo multimodal
- Diálogo situado e incorporado
- Diálogo visualmente fundamentado
- Diálogo proativo
- Misc. de diálogo proativo
- Diálogo orientado para o alvo
- Diálogo não colaborativo (persuasão e negociação)
- Diálogo personalizado
- Diálogo baseado em personagens
- Diálogo com reconhecimento de personalidade
- Diálogo baseado em personalidade
- Diálogo emocional
- Diálogo de apoio emocional
- Diálogo empático
- Diálogo de recomendação e CRS
- Diálogo fundamentado no conhecimento
- Diálogo orientado para a tarefa
- Diálogo de domínio aberto
- Diálogo a longo prazo
- Geração de resposta
- Avaliação de diálogo
- Diálogo Misc.
- Geração de linguagem natural
- Pesquisa sobre NLG
- Teorias e técnicas de NLG
- Modelos de difusão para NLG
- Geração controlável
- Planejamento de texto
- Algoritmos de decodificação
- Avaliação NLG
Aprendizagem profunda na PNL
- INLP : "Processamento interativo da linguagem natural". Arxiv (2023) [papel]
- Aumento dos dados : "Uma pesquisa com abordagens de aumento de dados para PNL". Flugings ACL (2021) [papel]
- Promoção : "Pré-treinar, prompt e prever: uma pesquisa sistemática de métodos de solicitação no processamento de linguagem natural". Arxiv (2021) [papel]
- Scope mundial da NLP : "Experiência na linguagem dos fundamentos". EMNLP (2020) [Paper]
- Transformer-xl : "Transformer-xl: modelos de idiomas atentos além de um contexto de comprimento fixo". ACL (2019) [Paper] [Código]
- Transformador : "Atenção é tudo o que você precisa". Neurips (2017) [Paper] [Code-Official] [Code-TF] [Code-Py]
- VAE : "Uma Introdução aos Autoencoders Variaivos". Arxiv (2019) [Artigo]
- Pesquisa sobre atenção : "Uma pesquisa introdutória sobre mecanismos de atenção nos problemas de PNL". Arxiv (2018) [Artigo]
- Atenção aditiva : "Tradução da máquina neural aprendendo em conjunto para alinhar e traduzir". ICLR (2015) [Paper]
- Atenção multiplicativa : "Abordagens eficazes para a tradução da máquina neural baseada em atenção". EMNLP (2015) [Artigo]
- Rede de memória : "redes de memória de ponta a ponta". Neurips (2015) [Artigo]
- Mecanismo de cópia (PGN) : "Chegue ao ponto: resumo com redes de generadores de ponteiro". ACL (2017) [Paper] [Código]
- Mecanismo de cópia : "Incorporando o mecanismo de cópia no aprendizado de sequência a sequência". ACL (2016) [Artigo]
- ELMO : "Representações de palavras contextualizadas profundas". NAACL (2018) [Paper] [Código]
- Luva : "Luva: vetores globais para representação de palavras". EMNLP (2014) [Paper] [Código]
- Tutorial do Word2vec : "Aprendizagem de parâmetros do Word2vec explicada". Arxiv (2016) [Artigo]
- Aprendizagem de várias tarefas : "Uma visão geral do aprendizado de várias tarefas em redes neurais profundas". Arxiv (2017) [Artigo]
- Descendência de gradiente : "Uma visão geral dos algoritmos de otimização de descida de gradiente". Arxiv (2016) [Artigo]
? De volta ao topo
Sistemas de diálogo
Pesquisa sobre diálogo
- Geração de dados : "Uma pesquisa sobre os recentes avanços na geração de dados de conversação". Arxiv (2024) [papel]
- Diálogo proativo : "Uma pesquisa sobre sistemas de diálogo proativo: problemas, métodos e perspectivas". Ijcai (2023) [Paper]
- Diálogo Responsável : "Avanços recentes em direção a sistemas de diálogo seguro, responsável e moral: uma pesquisa". Arxiv (2023) [papel]
- Diálogo de negociação : "Vamos negociar! Uma pesquisa sobre sistemas de diálogo de negociação". Arxiv (2022) [papel]
- Diálogo baseado em DL : "Avanços recentes em sistemas de diálogo baseados em aprendizado profundo: uma pesquisa sistemática". Arxiv (2021) [papel]
- Diálogo de domínio aberto : "Desafios na criação de sistemas de diálogo de domínio aberto inteligentes". Tois (2020) [Paper]
- Sistemas de diálogo : "Uma pesquisa sobre sistemas de diálogo: avanços recentes e novas fronteiras". Sigkdd Explorations (2017) [Paper]
- Diálogo Corpora : "Uma pesquisa do Corpora disponível para a construção de sistemas de diálogo orientados a dados". Arxiv (2017) [Paper] [Dados]
? De volta ao topo
Conversational LLMS
- Parrot : "Parrot: aprimorando os modelos de bate-papo com várias turnos aprendendo a fazer perguntas". Arxiv (2023) [papel]
- Memochat : "Memochat: Tuning LLMs para usar os memorandos para uma conversa consistente de longo alcance de domínio aberto". Arxiv (2023) [papel]
- LLAMA 2-BAT : "Llama 2: Fundação aberta e modelos de bate-papo ajustados". Meta (2023) [Paper] [Código]
- Chatglm3 : "Série ChatGlm3: LLMS de bate -papo bilíngue aberto". Tsinghua (2023) [Código]
- Chatglm2-6b : "Chatglm2-6b: um bate-papo bilíngue aberto LLM". Tsinghua (2023) [Código]
- MPC : "Apresentou o LLMS como módulos de chatbot para uma longa conversa em domínio aberto". Flugings ACL (2023) [Paper] [Código]
- MemoryBank-SiliconFriend : "MemoryBank: aprimorando grandes modelos de linguagem com memória de longo prazo". Arxiv (2023) [Paper] [Código]
- Ultrachat : "Aprimorando os modelos de linguagem de bate-papo, dimensionando conversas instrucionais de alta qualidade". Arxiv (2023) [Paper] [Dados]
- CHATALPACA : "CHATALPACA: um corpus de diálogo com várias turnos baseado nas instruções da ALPACA". Github (2023) [dados]
- Phoenix : "Phoenix: democratizando o chatgpt entre idiomas". Arxiv (2023) [Paper] [Código]
- Dolly : "Livre Dolly: Apresentando o primeiro LLM de instrução verdadeiramente aberto do mundo". Databricks (2023) [Código]
- Baize : "Baiate: um modelo de bate-papo de código aberto com ajuste com eficiência de parâmetro nos dados do auto-traseiro". Arxiv (2023) [Paper] [Código]
- Vicuna : "Vicuna: um chatbot de código aberto impressionando o GPT-4 com 90% de qualidade de chatgpt". Lmsys org (2023) [blog] [código]
- Koala : "Koala: um modelo de diálogo para pesquisa acadêmica". UC Berkeley (2023) [blog] [Código]
- BELLE : "Belle: seja o grande mecanismo de modelos de idiomas de todos". Lianjiatech (2023) [Código]
- ALPACA : "Alpaca: um modelo forte e replicável de seguir as seguintes". Stanford (2023) [Blog] [Code] [Alpaca-Lora]
- ChatGlm-6b : "Um modelo de linguagem de diálogo bilíngue aberto". Tsinghua (2023) [Código]
- Assistente aberto : "Assistente aberto: AI de conversação para todos". Github (2023) [Project] [Código]
- Chatgpt : "Chatgpt: otimizando modelos de linguagem para diálogo". Openai (2022) [blog]
- Sparrow : "Melhorando o alinhamento de agentes de diálogo por meio de julgamentos humanos direcionados". Arxiv (2022) [Paper] [Dados]
- BlenderBot3 : "Blenderbot 3: Um agente de conversação implantado que aprende continuamente a se envolver com responsabilidade". Arxiv (2022) [papel]
- Lamda : "Lamda: modelos de idiomas para aplicativos de diálogo". Arxiv (2022) [papel]
- Godel : "Godel: pré-treinamento em larga escala para diálogo dirigido por objetivos". Arxiv (2022) [Paper] [Código]
- Assistente Antrópico-V2 : "Treinando um assistente útil e inofensivo com o aprendizado de reforço com o feedback humano". Arxiv (2022) [papel]
- Assistente Antrópico : "Um Assistente de Língua Geral como laboratório de alinhamento". Arxiv (2021) [papel]
? De volta ao topo
Diálogo multimodal
Diálogo situado e incorporado
- SLL : "Diálogos situacionais baseados em modelos de linguagem grande para aprendizado de segunda língua". Arxiv (2024) [papel]
- Plano EMB : "Previsão de plano incorporado multimodal aumentado com diálogo incorporado sintético". EMNLP (2023) [papel]
- WTAG : "Os modelos de fundação podem assistir, conversar e guiar você passo a passo para fazer um bolo?". EMNLP-INDINGS (2023) [Paper] [Código]
- Simmc-vr : "Simmc-vr: um conjunto de diálogo multimodal orientado a tarefas com fluxos de VR situados e imersivos". ACL (2023) [papel]
- Claro : "Caixa de diálogo de recomendação multimodal com preferência subjetiva: um novo desafio e referência". ACL (2023) [Paper] [Dados]
- Açúcar : "Um conjunto de dados textual para seleção de resposta proativa situada". ACL (2023) [Paper] [Dados]
- Minddial : "Minddial: Dinâmica de crenças rastreando com modelagem teoria da mente para geração de diálogo neural situado". Arxiv (2023) [papel]
- Holoassista : "Holoassista: um conjunto de dados de interação humana egocêntrica para assistentes interativos de IA no mundo real". ICCV (2023) [Paper] [Dados]
- Collab : "Para a aquisição do plano colaborativo através da teoria da modelagem da mente em diálogo situado". Ijcai (2023) [Paper] [Código]
- Alexa Arena : "Alexa Arena: uma plataforma interativa centrada no usuário para IA incorporada". Arxiv (2023) [Paper] [Código]
- Gaivota : "gaivota: um agente incorporado para instruções seguintes através da caixa de diálogo situada". Alexa Prêmio Simbot Challenge (2023) [Paper]
- SITCOM-DETR : "A qual você está se referindo? Identificação de objetos multimodais em diálogo situado". EACL-SRW (2023) [Paper] [Código]
- MLR : "Melhorando agentes de conversação situados com o raciocínio lógico multimodal passo a passo". DSTC11 (2023) [papel]
- SimpleMtod : "SimpleMtod: um modelo de linguagem simples para o diálogo multimodal orientado a tarefas com representação simbólica da cena". Arxiv (2023) [papel]
- Primavera : "Primavera: o agente de conversas situado pré -criado com perguntas multimodais do gráfico de layout incremental". AAAI (2023) [Paper] [Código]
- Dorothie : "Dorothie: Diálogo falado para lidar com situações inesperadas em agentes de direção autônomos interativos". EMNLP-INDINGS (2022) [Paper] [Código]
- Currículo de luz : "Aprendizagem de diálogo situado através da geração do ambiente processual". ACL (2022) [papel]
- Danli : "Danli: agente deliberativo para seguir as instruções da linguagem natural". EMNLP (2022) [Paper] [Código]
- PRS : "Aprendendo a mediar as disparidades em relação à comunicação pragmática". ACL (2022) [Paper] [Código]
- Modelo articular : "Aprendendo a incorporar contextos multimodais para agentes de conversação situados". NAACL-INCILINGS (2022) [Paper] [Código]
- Teach_film : "Não copie o professor: dados e modelos desafios no diálogo incorporado". EMNLP (2022) [Paper] [Código]
- Ensino : "Ensine: agentes incorporados orientados por tarefas que bate-papo". AAAI (2022) [Paper] [Dados]
- Mindcraft : "Mindcraft: teoria da modelagem da mente para diálogo situado em tarefas colaborativas". EMNLP (2021) [Paper] [Código]
- Modelo multimodal : "Interações multimodais usando modelos unimodais pré-traidos para SIMMC 2.0". DSTC10 (2022) [Paper] [Código]
- SIMMC 2.0 : "Simmc 2.0: um conjunto de dados de diálogo orientado a tarefa para conversas multimodais imersivas" EMNLP (2021) [Paper] [Código]
- MM-DST : "Aprendizagem de várias tarefas para sistemas de diálogo de ponta a ponta de vários domínios situados". Arxiv (2021) [papel]
- Simmc : "Conversas multimodais situadas e interativas". Coling (2020) [Paper] [Código]
- Minecraft-BAP : "Aprendendo a executar instruções em um diálogo Minecraft". ACL (2020) [Paper] [Código]
- Cerealbar : "Executando as instruções em interações colaborativas situadas". EMNLP (2019) [Paper] [Código]
- Diálogo do Minecraft : "Diálogo colaborativo no Minecraft". ACL (2019) [Paper] [Código]
- CLG : "Linguagem colaborativa fundamentando em direção ao diálogo situado em rane -robôs". Revista AI (2016) [Paper]
- SHRD : "De volta ao mundo dos blocos: aprendendo novas ações através do diálogo situado de robô humano". Sigdial (2014) [Paper]
Diálogo visualmente fundamentado
- Tiger : "Tigre: uma estrutura de modelo generativo unificado para geração de resposta de diálogo multimodal". Coling (2024). [papel] [Código]
- Dialogcc : "Dialogcc: um pipeline automatizado para criar conjunto de dados de diálogo multimodal de alta qualidade". NAACL (2024) [Paper] [Dados]
- VLAW-MDM : "Uma estrutura para tarefas de aquecimento em linguagem de visão em modelos de diálogo multimodal". EMNLP (2023) [Paper] [Código]
- Zrigf : "Zrigf: uma estrutura multimodal inovadora para a geração de diálogo fundamentada por imagens com resistência zero". ACM MM (2023) [Paper] [Código]
- VDIALOGO : "VDIALOGO: Uma referência de avaliação unificada para diálogo visualmente fundamentado". Arxiv (2023) [papel]
- TEXTBIND : "TEXTBIND: Instrução multimodal intercalada de várias turnos intercalada que segue o Wild". Arxiv (2023) [Paper] [Dados]
- VSTAR : "VSTAR: um conjunto de dados de diálogo fundamentado em vídeo para entendimento semântico situado com transições de cena e tópico". ACL (2023) [Paper] [Dados]
- Comset : "Geração multimodal baseada em diálogo cômico". ACL (2023) [Paper] [Código]
- MPCHAT : "MPCHAT: em direção a uma conversa multimodal de persona". ACL (2023) [Paper] [Código]
- PACE : "PACE: diálogo multimodal unificado pré-treinamento com especialistas progressivos e de composição". ACL (2023) [Paper] [Código]
- Mmdialog : "Mmdialog: um conjunto de dados de diálogo em larga escala de várias turnos em direção a uma conversa de domínio aberto multimodal". ACL (2023) [Paper] [Dados]
- MDS-S2 : "O conhecimento semântico duplo compôs sistemas de diálogo multimodal". Sigir (2023) [Paper]
- TikTalk : "TikTalk: um conjunto de dados de diálogo multimodal para Chitchat do mundo real". Arxiv (2023) [Paper] [Código]
- Champagne : "Champagne: Aprendendo conversas do mundo real de vídeos da web em larga escala". Arxiv (2023) [Paper] [Código]
- MMCHAT : "MMCHAT: conjunto de dados de bate-papo multimodal nas mídias sociais". LREC (2022) [Paper] [Código]
- CRVD : "Raciocínio colaborativo em gráficos semânticos multimodais para geração de diálogo fundamentada em vídeo". EMNLP-INCILINGS (2022) [Papel]
- M3ED : "M3ED: Multi-Modal Multi-Scene Multi-Label Emothers Dialogue Database". ACL (2022) [Paper] [Dados]
- MDRG : "Geração de resposta de diálogo multimodal". ACL (2022) [papel]
- Unitranser : "Unitranser: uma estrutura de representação semântica de transformador unificada para o sistema de diálogo multimodal orientado para tarefas". ACL (2022) [papel]
- FotoChat : "Fotochat: um conjunto de dados de diálogo humano-humano com comportamento de compartilhamento de fotos para modelagem conjunta de texto de imagem". ACL (2021) [Paper] [Dados]
- Diálogo multimodal : "Construindo o conjunto de dados de diálogo multimodal, substituindo o texto por imagens semanticamente relevantes". ACL (2021) [Paper] [Código]
- OpenVidial 2.0 : "OpenVidial 2.0: um conjunto de dados de geração de diálogo em larga escala e domínio aberto com contextos visuais". Arxiv (2021) [Paper] [Dados]
- Tesouro : "Sistema de diálogo multimodal: compreensão da pergunta relacional baseada em gráficos". ACM MM (2021) [Paper] [Código]
- MMCONV : "MMCONV: Um ambiente para pesquisa de conversação multimodal em vários domínios". Sigir (2021) [Paper] [Dados]
- Chat da imagem : "Chat da imagem: Conversas de aterramento envolventes". ACL (2020) [Paper] [Dados]
- MTN : "Redes de transformadores multimodais para sistemas de diálogo de ponta a ponta". ACL (2019) [Paper] [Código]
- MELD : "MELD: Um conjunto de dados multimodal multipartidário para reconhecimento de emoções em conversas". ACL (2019) [Paper] [Dados]
- CLEVR-DIALOG : "CLEVR-DIALOG: Um conjunto de dados de diagnóstico para raciocínio de várias rodadas na caixa de diálogo visual". NAACL (2019) [Paper] [Dados]
- Visdial-RL : "Melhorando o diálogo visual generativo, respondendo a diversas perguntas". EMNLP (2019) [Paper] [Código]
- Magic : "Sistema de diálogo multimodal: gerando respostas através de decodificadores adaptativos". ACM MM (2019) [Paper] [Código]
- KMD : "Sistemas de diálogo multimodal com reconhecimento de conhecimento". ACM MM (2018) [Paper]
- MMD : "Para construir sistemas de conversação multimodal de grande escala". AAAI (2018) [Paper] [Dados]
- Fale a caminhada : "Fale a caminhada: navegando em Nova York por meio de diálogo fundamentado". Arxiv (2018) [Paper] [Código]
- IGC : "Conversas de imagens: contexto multimodal para questões naturais e geração de respostas". IJCNLP (2017) [Paper] [Dados]
- Visdial : "Caixa de diálogo visual". CVPR (2017) [Paper] [Dados]
? De volta ao topo
Diálogo proativo
Misc. de diálogo proativo
- DPDP : "Planejando como Humano: uma estrutura de processo duplo para planejamento de diálogo". ACL (2024) [Paper] [Código]
- PCA : "Para agentes de conversação proativos centrados no ser humano". Sigir (2024) [Paper]
- Procot : "solicitando e avaliando grandes modelos de idiomas para diálogos proativos: esclarecimento, guiado por destino e não colaboração". EMNLP-INDINGS (2023) [Paper] [Código]
- Tutorial : "Consciência de metas para a IA conversacional: proatividade, não colaboratividade e além". ACL (2023) [papel]
Diálogo orientado para o alvo
- PAI : "Para sistemas de tutoria inteligentes orientados a objetivos na educação on-line". Arxiv (2023) [papel]
- TopDial : "Sistemas de diálogo proativos orientados a destino com personalização: formulação de problemas e curadoria de dados". EMNLP (2023) [Paper] [Código]
- RTCP : "Promoção conversacional controlada por alvos". EMNLP (2023) [Paper] [Código]
- MTGP : "MTGP: diálogo orientado para alvo de várias turnos guiado pelo caminho global generativo com voltas flexíveis". Flugings ACL (2023) [Paper] [Código]
- Cor : "Planejamento de diálogo via Brownian Bridge Stocástico Processo para diálogo proativo direcionado a objetivos". Flugings ACL (2023) [Paper] [Código]
- TOPKG : "TOPKG: diálogo orientado para o destino via planejamento global no gráfico de conhecimento". Coling (2022) [Paper] [Código]
- TGCP : "Planejamento de conversas de domínio aberto guiado por destino". Coling (2022) [Paper] [Código]
- FOP : "Controle de longo prazo para geração de diálogo: métodos e avaliação". NAACL (2022) [Paper] [Código]
- Coda : "Geração de resposta de diálogo guiada por destino usando o senso comum e o aumento de dados". NAACL-INCILINGS (2022) [Paper] [Código]
- Otters : "Otters: transições de tópicos de uma volta para o diálogo de domínio aberto". ACL (2021) [Paper] [Dados]
- CG-nar : "Pensando claramente, falando rápido: geração não autorregressiva guiada por conceito para sistemas de diálogo em domínio aberto". EMNLP (2021) [Paper] [Código]
- Duconv : "Conversação proativa de sexo-máquina com objetivos explícitos de conversa". ACL (2019) [Paper] [Código]
- CKC : "Modelo de conversação neural guiado por palavras-chave". AAAI (2021) [Paper] [Código]
- Knowhrl : "Conhecimento Gráfico de Planejamento de metas fundamentadas para geração de conversas em domínio aberto". Aaai (2020) [papel]
- DKRN : "Rede de roteamento de conhecimento dinâmico para conversas de domínio aberto guiado por destino". AAAI (2020) [Paper] [Código]
- TGCONV : "Conversação de domínio aberto guiado por destino". ACL (2019) [Paper] [Código]
Diálogo não colaborativo (persuasão e negociação)
- Trip : "A força está nas diferenças! Em direção a diálogos eficazes não colaborativos por meio do planejamento da estratégia personalizada". Arxiv (2024) [papel]
- INA : "INA: uma abordagem integrativa para melhorar as estratégias de negociação com o sistema de diálogo baseado em recompensa". EMNLP (2023) [Paper] [Dados]
- I-Pro : "Interagindo com o usuário não cooperativo: um novo paradigma para política de diálogo proativo". Sigir (2022) [Papel]
- PAAD : "Rumo a um agente de diálogo autônomo com reconhecimento de progressão". NAACL (2022) [Paper] [Código]
- Persrfi : "Refine e imite: redução da repetição e inconsistência nos diálogos de persuasão por meio de aprendizado de reforço e demonstração humana". EMNLP-INCILINGS (2021) [Paper] [Código]
- Resper : "Resper: modelando computacionalmente estratégias de resistência em conversas persuasivas". EACL (2021) [Paper] [Código]
- ARDM : "Modelo de diálogo recorrente alternativo com modelos de linguagem pré-treinados em larga escala". EACL (2021) [Paper] [Código]
- Dialografia : "Dialografia: incorporando redes interpretáveis de graph de estratégia em diálogos de negociação". ICLR (2021) [Paper] [Código]
- Negociação : "Melhorando os sistemas de diálogo para negociação com modelagem de personalidade". ACL (2021) [Paper] [Código]
- FEHED : "Aumentando sistemas de diálogo não colaborativos com histórico explícito de diálogo semântico e estratégico". ICLR (2020) [Paper] [Código]
- CTX-PSA : "Aprendendo a planejar e realizar separadamente para sistemas de diálogo aberto". EMNLP-INDINGS (2020) [Paper] [Código]
- Negociação-treinadora : "Um treinador de estratégia dinâmica para negociação eficaz". Sigdial (2019) [Paper] [Código]
- Persuasão para o Good: "Persuasão para o bem: em direção a um sistema de diálogo persuasivo personalizado para o bem social". ACL (2019) [Paper] [Dados]
- CraigslistBargain : "Estratégia de desacoplamento e geração em diálogos de negociação". EMNLP (2018) [Paper] [Dados]
? De volta ao topo
Diálogo personalizado
Diálogo baseado em personagens
- LLM-Werewolf : "Explorando grandes modelos de idiomas para jogos de comunicação: um estudo empírico sobre lobisomem". Arxiv (2023) [papel]
- Chatharuhi : "Chatharuhi: Revivendo o personagem de anime na realidade por meio de um modelo de linguagem grande". Arxiv (2023) [Relatório] [Código]
- DPCD : "Oi Sheldon! Criando personagens personalizados profundos de programas de TV". Arxiv (2023) [Paper] [Dados]
- Rico em Cornell : "Modelagem de linguagem personalizada de caracteres de tela usando anotações de metadados ricos". Arxiv (2023) [Paper] [Dados]
- Knudge : "Geração ontologicamente fiel de diálogos de caracteres não-jogadores". ARXIC (2022) [Papel]
- HPD : "Os grandes modelos de idiomas se encontram com Harry Potter: um conjunto de dados bilíngues para alinhar agentes de diálogo com caracteres". Arxiv (2022) [Paper] [Dados]
- DialStory : "Um benchmark para entender e gerar diálogo entre personagens em histórias". Arxiv (2022) [papel]
- CARECALL : "Construindo uma função especificada pelo sistema de diálogo aberto, alavancando modelos de idiomas em larga escala". NAACL (2022) [Paper] [Dados]
- PDP : "Conheça seu personagem favorito: Chatbot de domínio aberto imitando personagens ficcionais com apenas alguns enunciados". NAACL (2022) [Paper] [Código]
- RPA : "Eu sou eu ou você? Modelos de diálogo de última geração não conseguem manter uma identidade". NAACL-INDINGS (2022) [Papel]
- CaracterChat : "CaracterChat: apoiando a criação de personagens fictícios por meio de conversas e manifestação progressiva com um chatbot". ACM C&C (2021) [papel]
- Aloha : "Aloha: aprendizado artificial de atributos humanos para agentes de diálogo". AAAI (2020) [Paper] [Código]
- Luz : "Aprendendo a falar e agir em um jogo de aventura de texto de fantasia". EMNLP (2019) [Paper] [Dados]
Diálogo com reconhecimento de personalidade
- UBPL : "adaptar os traços de personalidade em grandes modelos de idiomas por meio de léxicos personalizados sem supervisão". Arxiv (2023) [papel]
- CaracterChat : "CaracterChat: Aprendendo a IA conversacional com apoio social personalizado". Arxiv (2023) [Paper] [Código]
- ChatGPT-MBTI : "O chatgpt pode avaliar as personalidades humanas? Uma estrutura de avaliação geral". Arxiv (2023) [Paper] [Código]
- Personalidade solicitada : "Controlar o estilo de personalidade em diálogo com aprendizado baseado em prontidão zero". IWSDS (2023) [Paper]
- CPED : "CPED: um conjunto de dados de diálogo personalizado e emocional chinês em larga escala para a IA conversacional". Arxiv (2022) [Paper] [Dados]
- PELD : "Selecione automaticamente emoção para resposta por meio da transição emocional afetada pela personalidade". Flugings ACL (2021) [Paper] [Dados]
- Friendspesona : "Reconhecimento automático de personalidade baseado em texto em monólogos e diálogos multipartidários usando redes atentas e incorporações contextuais". Resumo-aluno AAAI (2020) [Paper] [Dados]
- APR : "Identificando traços de personalidade usando dinâmica de sobreposição no diálogo multipartidário". Intespeech (2019) [Paper]
- PersonalDilaog : "Geração de diálogo personalizada com características diversificadas". Arxiv (2019) [Paper] [Dados]
- Pessoa : "Controle a variação estilística baseada em personalidade com geradores de linguagem natural neural". Sigdial (2018) [Paper] [Dados]
Diálogo baseado em personalidade
- COMPERDIAL : "Comperdial: Diálogo de diálogos e benchmark do Laronsense Persona". Arxiv (2024) [papel]
- IDL : "" Em diálogos que aprendemos ": para o diálogo personalizado sem perfis predefinidos por meio de aprendizado no diário". Arxiv (2024) [papel]
- Dialogicl : "criando um bom prompt ou fornecendo diálogos exemplares? Um estudo de aprendizado no contexto para geração de diálogo baseada em persona". Arxiv (2024) [papel]
- Varmi : "Construindo agentes de diálogo consistentes persona com aprendizado de reforço offline". EMNLP (2023) [Paper] [Código]
- Opela : "Quando a multidão encontra Persona: Criando um Corpus de diálogo Persona de Domínio Aberto em larga escala". Arxiv (2023) [Paper] [Dados]
- Orig : "Rumo à geração de diálogo personalizada robusta através da regularização da representação insensível à ordem". Flugings ACL (2023) [Paper] [Código]
- CLV : "Melhorando a geração de diálogo personalizada com variáveis latentes contrastantes: combinando persona esparsa e densa". ACL (2023) [Paper] [Código]
- SIMOAP : "SIMOAP: Melhore a coerência e a consistência na geração de diálogo baseada em persona via amostragem excessiva e pós-avaliação". ACL (2023) [Paper] [Código]
- LMEDR : "Aprendendo a memorizar as relações de implicações e discursos para diálogos consistentes com persona". AAAI (2023) [Paper] [Código]
- Recuperação à previsão : "Melhorando a consistência da personalidade na conversa da persona estendendo". CIKM (2022) [Paper] [Código]
- Implícita-pessoa : "Um gerador de diálogo personalizado com detecção implícita de persona do usuário". Coling (2022) [papel]
- CarecallMemory : "Mantenha-me atualizado! Gerenciamento de memória em conversas de longo prazo". EMNLP-INCILINGS (2022) [Paper] [Dados]
- Personadefense : "Você não conhece minha cor favorita: impedindo que as representações de diálogo revelem personas particulares dos falantes". NAACL (2022) [Paper] [Código]
- T-Tuning : "Construindo um sistema de diálogo personalizado com ajuste rápido". Naacl-SRW (2022) [Papel]
- Dulemon : "muito tempo sem ver! Conversa de domínio aberto com memória persona de longo prazo". Flugings ACL (2022) [Paper] [Dados]
- Informações : "Você realmente entende o que eu preciso: agentes de diálogos intelectuais e amigáveis que aterram ao conhecimento e persona". EMNLP-INDINGS (2022) [Paper] [Código]
- Foco : "Coloque uma conversa personalizada: conversas personalizadas de aterramento e conhecimento". AAAI (2022) [Paper] [Código]
- MSP : "Menos é mais: aprender a refinar a história do diálogo para geração de diálogo personalizada". NAACL (2022) [papel]
- GME : "Diálogos transferíveis de persona em campo por meio de edições mínimas fundamentadas". EMNLP (2021) [Paper] [Código]
- Bob : "Bob: Bert sobre Bert para treinamento de modelos de diálogo baseado em persona de dados personalizados limitados". ACL (2021) [Paper] [Código]
- PABST : "Enriquecimento não supervisionado de diálogo fundamentado persona com histórias de fundo". ACL (2021) [Paper] [Código]
- DHAP : "Um chatbot por pessoa: criando chatbots personalizados com base em perfis de usuário implícitos". Sigir (2021) [Paper]
- PCHATBOT : "PCHATBOT: um conjunto de dados em larga escala para chatbot personalizado". Sigir (2021) [Paper] [Dados]
- Compac : "Como fazer caminhadas? Você provavelmente gosta da natureza: diálogo fundamentado em persona com expansões de senso comum". EMNLP (2020) [Paper] [Código]
- Consistência pragmática : "Vou parecer comigo? Melhorando a consistência da persona em diálogos através da autoconsciência pragmática". EMNLP (2020) [Paper] [Código]
- XPERSONA : "XPERSONA: Avaliando chatbot personalizado multilíngue". Arxiv (2020) [Paper] [Dados]
- KVPI : "Identificação de consistência do perfil para agentes de diálogo em domínio aberto". EMNLP (2020) [Paper] [Código]
- GDR : "Gere, exclua e reescreva: uma estrutura de três estágios para melhorar a consistência da persona da geração de diálogo". ACL (2020) [papel]
- P^2BOT : "Você me impressiona: geração de diálogo via percepção de personalidade mútua". ACL (2020) [Paper] [Código]
- RCDG : "Gerando diálogos consistentes de persona, explorando a inferência de linguagem natural". AAAI (2020) [Paper] [Código]
- Persona-Sparse : "Um modelo de geração de diálogo personalizado baseado em treinamento pré-treinamento com dados de esvaziações de persona". Aaai (2020) [papel]
- Pessoawae : "Modelando a personalização em espaço contínuo para geração de respostas por meio de autoencoders aumentados de Wasserstein". EMNLP (2019) [Paper]
- PAML : "Personalizando os agentes de diálogo via meta-aprendizagem". ACL (2019) [Paper] [Código]
- Personachat : "Personalizando agentes de diálogo: eu tenho um cachorro, você também tem animais de estimação?" ACL (2018) [Paper] [Dados]
- PCCM : "Atribuindo personalidade/perfil a uma máquina de bate -papo para geração de conversação coerente". IJCAI (2018) [Artigo]
? De volta ao topo
Diálogo emocional
Diálogo de apoio emocional
- Viés de preferência : "Os grandes modelos de idiomas podem ser um bom defensor emocional? Mitigando o viés de preferência na conversa de apoio emocional". ACL (2024) [papel]
- ESCOT : "ESCOT: Rumo a sistemas de diálogo interpretáveis de apoio emocional". ACL (2024) [Paper] [Código]
- Muffin : "Muffin: mitigando a inútilidade em conversas de apoio emocional com feedback de IA multifacetado". Flugings ACL (2024) [Paper] [Código]
- DDRCU : "Recuperação dinâmica de demonstração e entendimento cognitivo para conversas de apoio emocional". Sigir (2024) [Paper] [Código]
- KEMI : "Sistema de diálogo iniciado por conhecimento misto para conversas de apoio emocional". ACL (2023) [Paper] [Código]
- CSCONV : "Um sistema de diálogo de estimulação cognitiva com fusão de conhecimento de várias fontes para anciãos com comprometimento cognitivo". ACL (2023) [Paper] [Código]
- Augesc : "Augesc: Aumentação de diálogo com grandes modelos de idiomas para conversas de apoio emocional". Flugings ACL (2023) [Papel]
- Transsc : "Transsc: suavizando a conversa de apoio emocional por meio da transição do estado de turno". Flugings ACL (2023) [Paper] [Código]
- Pal : "Pal: Geração de conversas de apoio emocional com agio pré-agente". Flugings ACL (2023) [Paper] [Código]
- MultiSC : "Melhorando a geração de diálogo de suporte emocional com várias turnos com o planejamento da estratégia Lookahead". EMNLP (2022) [Paper] [Código]
- Misc : "Misc: Um modelo misto de reconhecimento de estratégia que integra o Cometa para conversas de apoio emocional". ACL (2022) [Paper] [Código]
- C3KG : "C3KG: um gráfico de conhecimento de conversas com senso comum chinês". Flugings ACL (2022) [Paper] [Dados]
- GLHG : "Controle globalmente, entenda localmente: uma rede de gráficos hierárquicos globais para locais para conversas de suporte emocional". Ijcai (2022) [Paper]
- Esconv : "Rumo a sistemas de diálogo de suporte emocional". ACL (2021) [Paper] [Dados]
Diálogo empático
- StickerConv : "StickerConv: gerando respostas empáticas multimodais do zero". ACL (2024) [Paper] [Dados]
- Perceptiveagent : "Converse com agentes humanos: diálogo empático por meio da recepção e reação acústica perceptível". ACL (2024) [Paper] [Código]
- E-CORE : "E-CORE: Correlação da emoção aumentou a geração de diálogo empático" EMNLP (2023) [Paper]
- Empsoa : "Não se perca! Geração de respostas empáticas por meio da consciência explícita da auto-autêntica". Flugings ACL (2023) [Paper] [Código]
- Caso : "Caso: alinhando a cognição e o afeto grosso a fino pela geração de resposta empática". ACL (2023) [Paper] [Código]
- Cuidado : "Cuidado: Raciocínio de Causalidade para respostas empáticas por geração de gráficos condicionais". EMNLP-INDINGS (2022) [Paper] [Código]
- EMPGPT-3 : "O GPT-3 gera diálogos empáticos? Um novo método de seleção de exemplo de contexto e métrica de avaliação automática para geração de diálogo empático". Coling (2022) [Paper] [Código]
- Posemodial : "Para diálogos empáticos de várias turnos com elicitação de emoção positiva". Arxiv (2022) [papel]
- CEM : "CEM: geração de resposta empática com reconhecimento de senso comum". AAAI (2022) [Paper] [Código]
- Puxa : "Tomando perspectiva e pragmática para gerar respostas empáticas focadas nas causas da emoção". EMNLP (2021) [Paper] [Código]
- RECEC : "Melhorando a geração de resposta empática, reconhecendo a causa emocional nas conversas". EMNLP-INCILINGS (2021) [Paper] [Código]
- COMAE : "COMAE: uma estrutura hierárquica multifatorial para geração de resposta empática". Flugings ACL (2021) [Paper] [Código]
- Cuidado : "Cuidado: geração de resposta emocional com consciência do senso comum com conceitos latentes". AAAI (2021) [Paper] [Código]
- EMPDG : "EMPDG: geração de diálogo empático interativo de várias resolução". Coling (2020) [Paper] [Código]
- MIME : "MIME: imitar emoções para geração de resposta empática". EMNLP (2020) [Paper] [Código]
- PEC : "Para modelos de conversação empática baseados em persona". EMNLP (2020) [Paper] [Código]
- Moel : "Moel: mistura de ouvintes empáticos". EMNLP (2019) [Paper] [Código]
- EmpatheticDialogues : "Rumo aos modelos empáticos de conversação de domínio aberto: um novo benchmark e conjunto de dados". ACL (2019) [Paper] [Dados]
- Emods : "Gerando respostas com uma emoção específica na caixa de diálogo". ACL (2019) [Paper]
- Mojitalk : "Mojitalk: gerando respostas emocionais em escala". ACL (2018) [Artigo]
- ECM : "Máquina de bate -papo emocional: geração de conversas emocionais com memória interna e externa". AAAI (2018) [Paper] [Código]
? De volta ao topo
Diálogo de recomendação e CRS
- TCP-dial : "Siga-me: Planejamento de conversas para sistemas de diálogo de recomendação direcionados ao alvo". Arxiv (2022) [Paper] [Código]
- KERS : "Kers: Uma estrutura aprimorada pelo conhecimento para sistemas de diálogo de recomendação com vários subgois". EMNLP-INCILINGS (2021) [Paper] [Código]
- DURECDIAL2.0 : "DURECDIAL 2.0: Um corpus paralelo bilíngue para recomendação de conversação". EMNLP (2021) [Paper] [Código]
- DURECDIAL : "Rumo à recomendação de conversação sobre diálogos de vários tipos". ACL (2020) [Paper] [Código]
- TG-REDIAL : "Rumo ao sistema de recomendação de conversação guiado por tópicos". Coling (2020) [Paper] [Código]
- Inspirado : "Inspirado: em direção a sistemas de diálogo de recomendação sociável". EMNLP (2020) [Paper] [Dados]
- Gorecdial : "Recomendação como um jogo de comunicação: jogo de bot auto-supervisionado para diálogo orientado a gols". EMNLP (2019) [Paper] [Código]
- CRS-Survey : "Uma pesquisa sobre sistemas de recomendação de conversação". Pesquisas de computação ACM (2021) [papel]
- CRS-Survey : "Avanços e desafios nos sistemas de recomendação de conversação: uma pesquisa". Arxiv (2021) [papel]
- CRSLAB : "CRSLAB: um kit de ferramentas de código aberto para a construção do sistema de recomendação de conversação". Arxiv (2021) [Paper] [Código]
- MESE : "Melhorando a qualidade dos sistemas de recomendação de conversação com meta-informação com reconhecimento de contexto". NAACL (2022) [Paper] [Código]
- C2-CRS : "C2-CRS: Aprendizagem contrastiva grossa para a Fina para o sistema de recomendação de conversação". WSDM (2022) [Paper] [Código]
- BotPlay : "Self-Supervised Bot Play for Conversational Recommendation with Justifications". arXiv(2021) [paper]
- RID : "Finetuning Large-Scale Pre-trained Language Models for Conversational Recommendation with Knowledge Graph". arXiv(2021) [paper] [code]
- CRFR : "CRFR: Improving Conversational Recommender Systems via Flexible Fragments Reasoning on Knowledge Graphs". EMNLP(2021) [paper]
- NTRD : "Learning Neural Templates for Recommender Dialogue System". EMNLP(2021) [paper] [code]
- CR-Walker : "CR-Walker: Tree-Structured Graph Reasoning and Dialog Acts for Conversational Recommendation". EMNLP(2021) [paper] [code]
- RevCore : "RevCore: Review-augmented Conversational Recommendation". ACL-Findings(2021) [paper] [code]
- KECRS : "KECRS: Towards Knowledge-Enriched Conversational Recommendation System". arXiv(2021) [paper]
- FPAN : "Adapting User Preference to Online Feedback in Multi-round Conversational Recommendation". WSDM(2021) [paper] [code]
- UNICORN : "Unified Conversational Recommendation Policy Learning via Graph-based Reinforcement Learning". SIGIR(2021) [paper] [code]
- KGSF : "Improving Conversational Recommender Systems via Knowledge Graph based Semantic Fusion". KDD(2020) [paper] [code]
- CPR : "Interactive Path Reasoning on Graph for Conversational Recommendation". KDD(2020) [paper] [code]
- EAR : "Estimation-Action-Reflection: Towards Deep Interaction Between Conversational and Recommender Systems". WSDM(2020) [paper] [code]
- KBRD : "Towards Knowledge-Based Recommender Dialog System". EMNLP(2019) [paper] [code]
- ReDial : "Towards Deep Conversational Recommendations". NeurIPS(2018) [paper] [data]
? De volta ao topo
Knowledge-grounded Dialogue
- DOCTOR : "Dialogue Chain-of-Thought Distillation for Commonsense-aware Conversational Agents". EMNLP(2023) [paper] [code] [demo]
- GATE : "Well Begun is Half Done: Generator-agnostic Knowledge Pre-Selection for Knowledge-Grounded Dialogue". EMNLP(2023) [paper] [code]
- CONNER : "Beyond Factuality: A Comprehensive Evaluation of Large Language Models as Knowledge Generators". EMNLP(2023) [paper] [code]
- K-DIAL : "Improving Factual Consistency for Knowledge-Grounded Dialogue Systems via Knowledge Enhancement and Alignment". EMNLP-Findings(2023) [paper]
- GLM-Dialog : "GLM-Dialog: Noise-tolerant Pre-training for Knowledge-grounded Dialogue Generation". arXiv(2023) [paper] [code]
- RHO : "RHO (ρ): Reducing Hallucination in Open-domain Dialogues with Knowledge Grounding". ACL-Findings(2023) [paper] [code]
- MultiRefKGC : "There Is No Standard Answer: Knowledge-Grounded Dialogue Generation with Adversarial Activated Multi-Reference Learning". EMNLP(2022) [paper] [code]
- CorefDiffs : "CorefDiffs: Co-referential and Differential Knowledge Flow in Document Grounded Conversations". COLING(2022) [paper] [code]
- DTR : "Stylized Knowledge-Grounded Dialogue Generation via Disentangled Template Rewriting". NAACL(2022) [paper] [code]
- XDAI : "XDAI: A Tuning-free Framework for Exploiting Pre-trained Language Models in Knowledge Grounded Dialogue Generation". KDD(2022) [paper] [code]
- PersonaKGC : "There Are a Thousand Hamlets in a Thousand People's Eyes: Enhancing Knowledge-grounded Dialogue with Personal Memory". ACL(2022) [paper] [code]
- KI : "Lexical Knowledge Internalization for Neural Dialog Generation". ACL(2022) [paper] [code]
- DiffKG : "Towards Large-Scale Interpretable Knowledge Graph Reasoning for Dialogue Systems". ACL-Findings(2022) [paper] [code]
- KSAM : "KSAM: Infusing Multi-Source Knowledge into Dialogue Generation via Knowledge Source Aware Multi-Head Decoding". ACL-Findings(2022) [paper]
- MDSP : "Multi-Stage Prompting for Knowledgeable Dialogue Generation". ACL-Findings(2022) [paper] [code]
- FSB : "Few-Shot Bot: Prompt-Based Learning for Dialogue Systems". arXiv(2021) [paper] [code]
- P-GDG : "Exploring Prompt-based Few-shot Learning for Grounded Dialog Generation". arXiv(2021) [paper]
- KAT-TSLF : "A Three-Stage Learning Framework for Low-Resource Knowledge-Grounded Dialogue Generation". EMNLP(2021) [paper] [code]
- DIALKI : "DIALKI: Knowledge Identification in Conversational Systems through Dialogue-Document Contextualization". EMNLP(2021) [paper] [code]
- CoLV : "CoLV: A Collaborative Latent Variable Model for Knowledge-Grounded Dialogue Generation". EMNLP(2021) [paper]
- SKT-KG : "Augmenting Knowledge-grounded Conversations with Sequential Knowledge Transition". NAACL(2021) [paper]
- MSKE : "More is Better: Enhancing Open-Domain Dialogue Generation via Multi-Source Heterogeneous Knowledge". EMNLP(2021) [paper] [code]
- EARL : "EARL: Informative Knowledge-Grounded Conversation Generation with Entity-Agnostic Representation Learning". EMNLP(2021) [paper] [code]
- KGD-CF : "Increasing Faithfulness in Knowledge-Grounded Dialogue with Controllable Features". ACL(2021) [paper]
- SECE : "Space Efficient Context Encoding for Non-Task-Oriented Dialogue Generation with Graph Attention Transformer". ACL(2021) [paper] [code]
- MIKe : "Initiative-Aware Self-Supervised Learning for Knowledge-Grounded Conversations". SIGIR(2021) [paper] [code]
- GOKC : "Learning to Copy Coherent Knowledge for Response Generation". AAAI(2021) [paper] [code]
- KnowledGPT : "Knowledge-Grounded Dialogue Generation with Pre-trained Language Models". EMNLP(2020) [paper] [code]
- DiffKS : "Difference-aware Knowledge Selection for Knowledge-grounded Conversation Generation". EMNLP-Findings(2020) [paper] [code]
- DukeNet : "DukeNet: A Dual Knowledge Interaction Network for Knowledge-Grounded Conversation". SIGIR(2020) [paper] [code]
- CCN : "Cross Copy Network for Dialogue Generation". EMNLP(2020) [paper] [code]
- PIPM : "Bridging the Gap between Prior and Posterior Knowledge Selection for Knowledge-Grounded Dialogue Generation". EMNLP(2020) [paper]
- ConceptFlow : "Grounded Conversation Generation as Guided Traverses in Commonsense Knowledge Graphs". ACL(2020) [paper] [code]
- ConKADI : "Diverse and Informative Dialogue Generation with Context-Specific Commonsense Knowledge Awareness". ACL(2020) [paper] [code]
- KIC : "Generating Informative Conversational Response using Recurrent Knowledge-Interaction and Knowledge-Copy". ACL(2020) [paper]
- SKT : "Sequential Latent Knowledge Selection for Knowledge-Grounded Dialogue". ICLR(2020) [paper] [code]
- KdConv : "KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn Knowledge-driven Conversation". ACL(2020) [paper] [data]
- TransDG : "Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering". AAAI(2020) [paper] [code]
- RefNet : "RefNet: A Reference-aware Network for Background Based Conversation". AAAI(2020) [paper] [code]
- GLKS : "Thinking Globally, Acting Locally: Distantly Supervised Global-to-Local Knowledge Selection for Background Based Conversation". AAAI(2020) [paper] [code]
- AKGCM : "Knowledge Aware Conversation Generation with Explainable Reasoning over Augmented Graphs". EMNLP(2019) [paper] [code]
- DyKgChat : "DyKgChat: Benchmarking Dialogue Generation Grounding on Dynamic Knowledge Graphs". EMNLP(2019) [paper] [code]
- OpenDialKG : "OpenDialKG: Explainable Conversational Reasoning with Attention-based Walks over Knowledge Graphs". ACL(2019) [paper] [data]
- WoW : "Wizard of Wikipedia: Knowledge-Powered Conversational agents". ICLR(2019) [paper]
- PostKS : "Learning to Select Knowledge for Response Generation in Dialog Systems". IJCAI(2019) [paper] [code-1] [code-2]
- NKD : "Knowledge Diffusion for Neural Dialogue Generation". ACL(2018) [paper] [data]
- Dual Fusion : "Smarter Response with Proactive Suggestion: A New Generative Neural Conversation Paradigm". IJCAI(2018) [paper]
- CCM : "Commonsense Knowledge Aware Conversation Generation with Graph Attention". IJCAI(2018) [paper] [code-tf] [code-py]
- MTask : "A Knowledge-Grounded Neural Conversation Model". AAAI(2018) [paper]
- GenDS : "Flexible End-to-End Dialogue System for Knowledge Grounded Conversation". arXiv(2017) [paper]
? De volta ao topo
Task-oriented Dialogue
- P-ToD : "Personalizing Task-oriented Dialog Systems via Zero-shot Generalizable Reward Function". CIKM(2022) [paper]
- Dialogic : "Dialogic: Controllable Dialogue Simulation with In-Context Learning". EMNLP-Findings(2022) [paper] [code]
- KB-Adapter : "Injecting Domain Knowledge in Language Models for Task-Oriented Dialogue Systems". EMNLP(2022) [paper] [code]
- TacoBot : "Bootstrapping a User-Centered Task-Oriented Dialogue System". Proceedings of Alexa Prize TaskBot(2021) [paper]
- USDA : "User Satisfaction Estimation with Sequential Dialogue Act Modeling in Goal-oriented Conversational Systems". WWW(2022) [paper] [code]
- USS : "Simulating User Satisfaction for the Evaluation of Task-oriented Dialogue Systems". SIGIR(2021) [paper] [data]
- NS-Dial : "An Interpretable Neuro-Symbolic Reasoning Framework for Task-Oriented Dialogue Generation". ACL(2022) [paper] [code]
- GALAXY : "GALAXY: A Generative Pre-trained Model for Task-Oriented Dialog with Semi-Supervised Learning and Explicit Policy Injection". AAAI(2022) [paper] [code]
- PPTOD : "Multi-Task Pre-Training for Plug-and-Play Task-Oriented Dialogue System". arXiv(2021) [paper] [code]
- ToDCL : "Continual Learning in Task-Oriented Dialogue Systems". EMNLP(2021) [paper] [code]
- IR-Net : "Intention Reasoning Network for Multi-Domain End-to-end Task-Oriented Dialogue". EMNLP(2021) [paper]
- HyKnow : "HyKnow: End-to-End Task-Oriented Dialog Modeling with Hybrid Knowledge Management". ACL-Findings(2021) [paper] [code]
- DDMN : "Dual Dynamic Memory Network for End-to-End Multi-turn Task-oriented Dialog Systems". COLING(2020) [paper] [code]
- ToD-BERT : "ToD-BERT: Pre-trained Natural Language Understanding for Task-Oriented Dialogues". EMNLP(2020) [paper] [code]
- GraphDialog : "GraphDialog: Integrating Graph Knowledge into End-to-End Task-Oriented Dialogue Systems". EMNLP(2020) [paper] [code]
- MARCO : "Multi-Domain Dialogue Acts and Response Co-Generation". ACL(2020) [paper] [code]
- DF-Net : "Dynamic Fusion Network for Multi-Domain End-to-end Task-Oriented Dialog". ACL(2020) [paper] [code]
- MALA : "MALA: Cross-Domain Dialogue Generation with Action Learning". AAAI(2020) [paper]
- SGD : "Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset". AAAI(2020) [paper] [data]
- CrossWOZ : "CrossWOZ: A Large-Scale Chinese Cross-Domain Task-Oriented Dialogue Dataset". TACL(2020) [paper] [code]
- MultiWOZ : "MultiWOZ - A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling". EMNLP(2018) [paper] [code]
- Neural Task-Oriented Dialogue : "Learning to Memorize in Neural Task-Oriented Dialogue Systems". MPhil Thesis(2019) [paper]
- GLMP : "Global-to-local Memory Pointer Networks for Task-Oriented Dialogue". ICLR(2019) [paper] [code]
- KB Retriever : "Entity-Consistent End-to-end Task-Oriented Dialogue System with KB Retriever". EMNLP(2019) [paper] [data]
- TRADE : "Transferable Multi-Domain State Generator for Task-Oriented Dialogue Systems". ACL(2019) [paper] [code]
- WMM2Seq : "A Working Memory Model for Task-oriented Dialog Response Generation". ACL(2019) [paper]
- Pretrain-Fine-tune : "Training Neural Response Selection for Task-Oriented Dialogue Systems". ACL(2019) [paper] [data]
- Multi-level Mem : "Multi-Level Memory for Task Oriented Dialogs". NAACL(2019) [paper] [code]
- BossNet : "Disentangling Language and Knowledge in Task-Oriented Dialogs ". NAACL(2019) [paper] [code]
- SDN : "Subgoal Discovery for Hierarchical Dialogue Policy Learning". EMNLP(2018) [paper]
- D3Q : "Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning". EMNLP(2018) [paper] [code]
- DDQ : "Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning". ACL(2018) [paper] [code]
- MAD : "Memory-augmented Dialogue Management for Task-oriented Dialogue Systems". TOIS(2018) [paper]
- TSCP : "Sequicity: Simplifying Task-oriented Dialogue Systems with Single Sequence-to-Sequence Architectures". ACL(2018) [paper] [code]
- Mem2Seq : "Mem2Seq: Effectively Incorporating Knowledge Bases into End-to-End Task-Oriented Dialog Systems". ACL(2018) [paper] [code]
- Topic-Seg-Label : "A Weakly Supervised Method for Topic Segmentation and Labeling in Goal-oriented Dialogues via Reinforcement Learning". IJCAI(2018) [paper] [code]
- AliMe : "AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine". ACL(2017) [paper]
- KVR Net : "Key-Value Retrieval Networks for Task-Oriented Dialogue". SIGDIAL(2017) [paper] [data]
? De volta ao topo
Open-domain Dialogue
Long-term Dialogue
- THEANINE : "THEANINE: Revisiting Memory Management in Long-term Conversations with Timeline-augmented Response Generation". arXiv(2024) [paper]
- LD-Agent : "Hello Again! LLM-powered Personalized Agent for Long-term Dialogue". arXiv(2024) [paper] [code]
- CPD : "Position Debiasing Fine-Tuning for Causal Perception in Long-Term Dialogue". IJCAI(2024) [paper]
- TemporalMemory : "Toward Conversational Agents with Context and Time Sensitive Long-term Memory". arXiv(2024) [paper] [data]
- LoCoMo : "Evaluating Very Long-Term Conversational Memory of LLM Agents". ACL(2024) [paper] [data]
- Conversation Chronicles : "Conversation Chronicles: Towards Diverse Temporal and Relational Dynamics in Multi-Session Conversations". EMNLP(2023) [paper] [data]
- GapChat : "Mind the Gap Between Conversations for Improved Long-Term Dialogue Generation". EMNLP-Findings(2023) [paper] [data]
- UniMC : "UniMC: A Unified Framework for Long-Term Memory Conversation via Relevance Representation Learning". arXiv(2023) [paper]
- RS : "Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models". arXiv(2023) [paper]
- MSC : "Beyond Goldfish Memory: Long-Term Open-Domain Conversation". ACL(2022) [paper] [data]
Response Generation
- Overview : "Open-domain Dialogue Generation: What We Can Do, Cannot Do, And Should Do Next". ACL-NLP4ConvAI(2022) [paper]
- Chirpy Cardinal : "Neural Generation Meets Real People: Building a Social, Informative Open-Domain Dialogue Agent". SIGDIAL(2022) [paper] [code] [project]
- TIL : "Towards Efficient Dialogue Pre-training with Transferable and Interpretable Latent Structure". EMNLP(2022) [paper]
- ProphetChat : "ProphetChat: Enhancing Dialogue Generation with Simulation of Future Conversation". ACL(2022) [paper]
- DialoFlow : "Conversations Are Not Flat: Modeling the Dynamic Information Flow across Dialogue Utterances". ACL(2021) [paper] [code]
- DiSCoL : "DiSCoL: Toward Engaging Dialogue Systems through Conversational Line Guided Response Generation". NAACL(2021) [paper] [code]
- DialogBERT : "DialogBERT: Discourse-Aware Response Generation via Learning to Recover and Rank Utterances". AAAI(2021) [paper]
- BlenderBot : "Recipes for Building an Open-Domain Chatbot". EACL(2021) [paper] [code]
- CDial-GPT : "A Large-Scale Chinese Short-Text Conversation Dataset". NLPCC(2020) [paper] [code]
- DialoGPT : "DialoGPT : Large-Scale Generative Pre-training for Conversational Response Generation". ACL(2020) [paper] [code]
- CG-Policy : "Conversational Graph Grounded Policy Learning for Open-Domain Conversation Generation". ACL(2020) [paper]
- PLATO-XL : "PLATO-XL: Exploring the Large-scale Pre-training of Dialogue Generation". arXiv(2021) [paper] [code]
- PLATO-2 : "PLATO-2: Towards Building an Open-Domain Chatbot via Curriculum Learning". ACL-Findings(2021) [paper] [code]
- PLATO : "PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable". ACL(2020) [paper] [code]
- Guyu : "An Empirical Investigation of Pre-Trained Transformer Language Models for Open-Domain Dialogue Generation". arXiv(2020) [paper] [code]
- CL4Dialogue : "Group-wise Contrastive Learning for Neural Dialogue Generation". EMNLP-Findings(2020) [paper] [code]
- Neg-train : "Negative Training for Neural Dialogue Response Generation". ACL(2020) [paper] [code]
- HDSA : "Semantically Conditioned Dialog Response Generation via Hierarchical Disentangled Self-Attention". ACL(2019) [paper] [code]
- CAS : "Skeleton-to-Response: Dialogue Generation Guided by Retrieval Memory". NAACL(2019) [paper] [code]
- Edit-N-Rerank : "Response Generation by Context-aware Prototype Editing". AAAI(2019) [paper] [code]
- HVMN : "Hierarchical Variational Memory Network for Dialogue Generation". WWW(2018) [paper] [code]
- XiaoIce : "The Design and Implementation of XiaoIce, an Empathetic Social Chatbot". arXiv(2018) [paper]
- D2A : "Dialog-to-Action: Conversational Question Answering Over a Large-Scale Knowledge Base". NeurIPS(2018) [paper] [code]
- DAIM : "Generating Informative and Diverse Conversational Responses via Adversarial Information Maximization". NeurIPS(2018) [paper]
- REASON : "Dialog Generation Using Multi-turn Reasoning Neural Networks". NAACL(2018) [paper]
- STD/HTD : "Learning to Ask Questions in Open-domain Conversational Systems with Typed Decoders". ACL(2018) [paper] [code]
- CSF : "Generating Informative Responses with Controlled Sentence Function". ACL(2018) [paper] [code]
- DAWnet : "Chat More: Deepening and Widening the Chatting Topic via A Deep Model". SIGIR(2018) [paper] [code]
- ZSDG : "Zero-Shot Dialog Generation with Cross-Domain Latent Actions". SIGDIAL(2018) [paper] [code]
- DUA : "Modeling Multi-turn Conversation with Deep Utterance Aggregation". COLING(2018) [paper] [code]
- Data-Aug : "Sequence-to-Sequence Data Augmentation for Dialogue Language Understanding". COLING(2018) [paper] [code]
- DC-MMI : "Generating More Interesting Responses in Neural Conversation Models with Distributional Constraints". EMNLP(2018) [paper] [code]
- cVAE-XGate/CGate : "Better Conversations by Modeling, Filtering, and Optimizing for Coherence and Diversity". EMNLP(2018) [paper] [code]
- Retrieval+multi-seq2seq : "An Ensemble of Retrieval-Based and Generation-Based Human-Computer Conversation Systems". IJCAI(2018) [paper]
- DAM : "Multi-Turn Response Selection for Chatbots with Deep Attention Matching Network". ACL(2018) [paper] [code]
- SMN : "Sequential Matching Network: A New Architecture for Multi-turn Response Selection in Retrieval-Based Chatbots". ACL(2017) [paper] [code]
- CVAE/KgCVAE : "Learning Discourse-level Diversity for Neural Dialog Models using Conditional Variational Autoencoders". ACL(2017) [paper] [code]
- TA-Seq2Seq : "Topic Aware Neural Response Generation". AAAI(2017) [paper] [code]
- MA : "Mechanism-Aware Neural Machine for Dialogue Response Generation". AAAI(2017) [paper]
- VHRED : "A Hierarchical Latent Variable Encoder-Decoder Model for Generating Dialogues". AAAI(2017) [paper] [code]
- HRED : "Building End-To-End Dialogue Systems Using Generative Hierarchical Neural Network Models". AAAI(2016) [paper] [code]
- RL-Dialogue : "Deep Reinforcement Learning for Dialogue Generation". EMNLP(2016) [paper]
- MMI : "A Diversity-Promoting Objective Function for Neural Conversation Models". NAACL(2016) [paper] [code]
? De volta ao topo
Dialogue Evaluation
- DialogBench : "DialogBench: Evaluating LLMs as Human-like Dialogue Systems". NAACL(2024) [paper] [code]
- ChatEval : "ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate". arXiv(2023) [paper] [code]
- ACCENT : "ACCENT: An Automatic Event Commonsense Evaluation Metric for Open-Domain Dialogue Systems". ACL(2023) [paper] [code]
- LLMEval : "Understanding the Effectiveness of Very Large Language Models on Dialog Evaluation". IWSDS(2023) [paper]
- ChatEvalPlatform : "Don't Forget Your ABC's: Evaluating the State-of-the-Art in Chat-Oriented Dialogue Systems". arXiv(2022) [paper] [code]
- MDD-Eval : "MDD-Eval: Self-Training on Augmented Data for Multi-Domain Dialogue Evaluation". AAAI(2022) [paper] [code]
- Self-Eval : "SelF-Eval: Self-supervised Fine-grained Dialogue Evaluation". COLING(2022) [paper] [code]
- FineD-Eval : "FineD-Eval: Fine-grained Automatic Dialogue-Level Evaluation". EMNLP(2022) [paper] [code]
- FlowEval : "FlowEval: A Consensus-Based Dialogue Evaluation Framework Using Segment Act Flows". EMNLP(2022) [paper]
- IM2 : "IM^2: an Interpretable and Multi-category Integrated Metric Framework for Automatic Dialogue Evaluation". EMNLP(2022) [paper] [code]
- Q^2 : "$Q^{2}$: Evaluating Factual Consistency in Knowledge-Grounded Dialogues via Question Generation and Question Answering". EMNLP(2021) [paper] [code]
- QuantiDCE : "Towards Quantifiable Dialogue Coherence Evaluation". ACL(2021) [paper] [code]
- DynaEval : "DynaEval: Unifying Turn and Dialogue Level Evaluation". ACL(2021) [paper] [code]
- Review : "How to Evaluate Your Dialogue Models: A Review of Approaches". arXiv(2021) [paper]
- ConvLabEval : "Is Your Goal-Oriented Dialog Model Performing Really Well? Empirical Analysis of System-wise Evaluation". SIGDIAL(2020) [paper]
- FED : "Unsupervised Evaluation of Interactive Dialog with DialoGPT". SIGDIAL(2020) [paper] [code] [data]
- Spot-the-Bot : "Spot The Bot: A Robust and Efficient Framework for the Evaluation of Conversational Dialogue Systems". EMNLP(2020) [paper] [code]
- CMADE : "Beyond User Self-Reported Likert Scale Ratings: A Comparison Model for Automatic Dialog Evaluation". ACL(2020) [paper] [code]
- Coherence : "Dialogue Coherence Assessment Without Explicit Dialogue Act Labels". ACL(2020) [paper] [code]
- MAUDE : "Learning an Unreferenced Metric for Online Dialogue Evaluation". ACL(2020) [paper] [code]
- GRADE : "GRADE: Automatic Graph-Enhanced Coherence Metric for Evaluating Open-Domain Dialogue Systems". ACL(2020) [paper] [code]
- uBLEU : "uBLEU: Uncertainty-Aware Automatic Evaluation Method for Open-Domain Dialogue Systems". ACL(2020) [paper] [code]
- USR : "USR: An Unsupervised and Reference Free Evaluation Metric for Dialog Generation". ACL(2020) [paper] [code]
- ACUTE-EVAL : "ACUTE-EVAL: Improved Dialogue Evaluation with Optimized Questions and Multi-turn Comparisons". NIPS ConvAI Workshop(2019) [paper] [code]
- InteractiveEval : "Approximating Interactive Human Evaluation with Self-Play for Open-Domain Dialog Systems". NeurIPS(2019) [paper] [code]
- ChatEval : "ChatEval: A Tool for Chatbot Evaluation". NAACL(2019) [paper] [project]
- ADVMT : "One
Ruler for All Languages: Multi-Lingual Dialogue Evaluation with Adversarial Multi-Task Learning". IJCAI(2018) [paper]
? De volta ao topo
Dialogue Misc.
- Signed-dialogue : "Generating Signed Language Instructions in Large-Scale Dialogue Systems". NAACL(2024) [paper] [data]
- Dialogue-KT : "Exploring Knowledge Tracing in Tutor-Student Dialogues". arXiv(2024) [paper] [code]
- MathDial : "MathDial: A Dialogue Tutoring Dataset with Rich Pedagogical Properties Grounded in Math Reasoning Problems". EMNLP-Findings(2023) [paper] [data]
- EduChat : "EduChat: A Large-Scale Language Model-based Chatbot System for Intelligent Education". arXiv(2023) [paper] [code]
- ACT : "Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training". arXiv(2024) [paper]
- ReviewMT : "Peer Review as A Multi-Turn and Long-Context Dialogue with Role-Based Interactions". arXiv(2024) [paper] [code]
- WildChat : "WildChat: 1M ChatGPT Interaction Logs in the Wild". ICLR(2024) [paper] [data]
- DialOp : "Decision-Oriented Dialogue for Human-AI Collaboration". arXiv(2023) [paper] [code]
- DialogStudio : "DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection for Conversational AI". arXiv(2023) [paper] [code]
- MPC : "Multi-Party Chat: Conversational Agents in Group Settings with Humans and Models". arXiv(2023) [paper] [code]
- SODA : "SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization". EMNLP(2023) [paper] [code]
- speaker-adaptation : "Speaking the Language of Your Listener: Audience-Aware Adaptation via Plug-and-Play Theory of Mind". ACL-Findings(2023) [paper] [code]
- SocialDial : "SocialDial: A Benchmark for Socially-Aware Dialogue Systems". SIGIR(2023) [paper] [data]
- BotsTalk : "BotsTalk: Machine-sourced Framework for Automatic Curation of Large-scale Multi-skill Dialogue Datasets". EMNLP(2022) [paper] [code]
- Dialogic : "Dialogic: Controllable Dialogue Simulation with In-Context Learning". EMNLP-Findings(2022) [paper] [code]
- ProsocialDialog : "ProsocialDialog: A Prosocial Backbone for Conversational Agents". EMNLP(2022) [paper] [code]
- MIC : "The Moral Integrity Corpus: A Benchmark for Ethical Dialogue Systems". ACL(2022) [paper] [code]
- MoralDial : "MoralDial: A Framework to Train and Evaluate Moral Dialogue Systems via Constructing Moral Discussions". arXiv(2022) [paper]
- DECODE : "I like fish, especially dolphins: Addressing Contradictions in Dialogue Modeling". ACL(2021) [paper] [code]
? De volta ao topo
Natural Language Generation
Survey on NLG
- CTG : "A Survey of Controllable Text Generation using Transformer-based Pre-trained Language Models". arXiv(2022) [paper]
- RTG : "A Survey on Retrieval-Augmented Text Generation". arXiv(2022) [paper]
- Hallucination : "Survey of Hallucination in Natural Language Generation". arXiv(2022) [paper]
- Evaluation : "A Survey of Evaluation Metrics Used for NLG Systems". arXiv(2020) [paper]
? De volta ao topo
NLG Theories and Techniques
- RED : "Decoder-Only or Encoder-Decoder? Interpreting Language Model as a Regularized Encoder-Decoder". arXiv(2023) [paper]
- LaMemo : "LaMemo: Language Modeling with Look-Ahead Memory". NAACL(2022) [paper] [code]
- PTG : "Learning to Transfer Prompts for Text Generation". NAACL(2022) [paper] [code]
- EISL : "Don't Take It Literally: An Edit-Invariant Sequence Loss for Text Generation". NAACL(2022) [paper] [code]
- CT-Loss : "A Simple Contrastive Learning Objective for Alleviating Neural Text Degeneration". arXiv(2022) [paper] [code]
- SimCTG : "A Contrastive Framework for Neural Text Generation". NeurIPS(2022) [paper] [code]
- CoNT : "CoNT: Contrastive Neural Text Generation". NeurIPS(2022) [paper] [code]
- Two-level-CL : "Keywords and Instances: A Hierarchical Contrastive Learning Framework Unifying Hybrid Granularities for Text Generation". ACL(2022) [paper]
- CLAPS : "Contrastive Learning with Adversarial Perturbations for Conditional Text Generation". ICLR(2021) [paper] [code]
- RetGen : "RetGen: A Joint framework for Retrieval and Grounded Text Generation Modeling". AAAI(2022) [paper] [code]
- RAG : "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks". NeurIPS(2020) [paper] [code]
- TextGAIL : "TextGAIL: Generative Adversarial Imitation Learning for Text Generation". AAAI(2021) [paper] [code]
- Latent-GLAT : " latent -GLAT: Glancing at Latent Variables for Parallel Text Generation". ACL(2022) [paper] [code]
- s2s-ft : "s2s-ft: Fine-Tuning Pretrained Transformer Encoders for Sequence-to-Sequence Learning". arXiv(2021) [paper] [code]
- EBM : "Exposure Bias versus Self-Recovery: Are Distortions Really Incremental for Autoregressive Text Generation?". EMNLP(2021) [paper]
- DiscoDVT : "DiscoDVT: Generating Long Text with Discourse-Aware Discrete Variational Transformer". EMNLP(2021) [paper] [code]
- DATG : "Data Augmentation for Text Generation Without Any Augmented Data". ACL(2021) [paper]
- JointGT : "JointGT: Graph-Text Joint Representation Learning for Text Generation from Knowledge Graphs". ACL-Findings(2021) [paper] [code]
- Embedding-Transfer : "Bridging Subword Gaps in Pretrain-Finetune Paradigm for Natural Language Generation". ACL(2021) [paper] [code]
- FastSeq : "EL-Attention: Memory Efficient Lossless Attention for Generation". ICML(2021) [paper] [code]
- BERTSeq2Seq : "Leveraging Pre-trained Checkpoints for Sequence Generation Tasks". TACL(2020) [paper] [code-tf] [code-py]
- ERNIE-GEN : "ERNIE-GEN: An Enhanced Multi-Flow Pre-training and Fine-tuning Framework for Natural Language Generation". IJCAI(2020) [paper] [code]
- DITTO : "Learning to Break the Loop: Analyzing and Mitigating Repetitions for Neural Text Generation". NeurIPS(2022) [paper] [code]
- Repetition-Problem : "A Theoretical Analysis of the Repetition Problem in Text Generation". AAAI(2021) [paper] [code]
- ENCONTER : "ENCONTER: Entity Constrained Progressive Sequence Generation via Insertion-based Transformer". EACL(2021) [paper] [code]
- POINTER : "POINTER: Constrained Progressive Text Generation via Insertion-based Generative Pre-training". EMNLP(2020) [paper] [code]
- Cascaded Generation : "Cascaded Text Generation with Markov Transformers". NeurIPS(2020) [paper] [code]
- SFOT : "Improving Text Generation with Student-Forcing Optimal Transport". EMNLP(2020) [paper]
- OT-Seq2Seq : "Improving Sequence-to-Sequence Learning via Optimal Transport". ICLR(2019) [paper] [code]
? De volta ao topo
Diffusion Models for NLG
- RenderDiffusion : "RenderDiffusion: Text Generation as Image Generation". arXiv(2023) [paper]
- Masked-Diffusion-LM : "A Cheaper and Better Diffusion Language Model with Soft-Masked Noise". arXiv(2023) [paper] [code]
- discrete-diffusion : "A Reparameterized Discrete Diffusion Model for Text Generation". arXiv(2023) [paper] [code]
- Difformer : "Difformer: Empowering Diffusion Models on the Embedding Space for Text Generation". arXiv(2023) [paper]
- GENIE : "Text Generation with Diffusion Language Models: A Pre-training Approach with Continuous Paragraph Denoise". arXiv(2022) [paper] [code]
- SED : "Self-conditioned Embedding Diffusion for Text Generation". arXiv(2022) [paper]
- SSD-LM : "SSD-LM: Semi-autoregressive Simplex-based Diffusion Language Model for Text Generation and Modular Control". arXiv(2022) [paper] [code]
- LD4LG : "Latent Diffusion for Language Generation". arXiv(2022) [paper] [code]
- DiffusionBERT : "DiffusionBERT: Improving Generative Masked Language Models with Diffusion Models". arXiv(2022) [paper] [code]
- DiffusER : "DiffusER: Discrete Diffusion via Edit-based Reconstruction". arXiv(2022) [paper] [code]
- SeqDiffuSeq : "SeqDiffuSeq: Text Diffusion with Encoder-Decoder Transformers". arXiv(2022) [paper] [code]
- DiffuSeq : "DiffuSeq: Sequence to Sequence Text Generation with Diffusion Models". ICLR(2023) [paper] [code]
- Diffusion-LM : "Diffusion-LM Improves Controllable Text Generation". NeurIPS(2022) [paper] [code]
- D3PM : "Structured Denoising Diffusion Models in Discrete State-Spaces". NeurIPS(2021) [paper] [code]
? De volta ao topo
Controllable Generation
- ConGenBench : "Controllable Text Generation in the Instruction-Tuning Era". arXiv(2024) [paper] [code]
- GeLaTo : "Tractable Control for Autoregressive Language Generation". arXiv(2023) [paper]
- Cognac : "Controllable Text Generation with Language Constraints". arXiv(2022) [paper] [code]
- CriticControl : "Critic-Guided Decoding for Controlled Text Generation". arXiv(2022) [paper]
- LatentOps : "Composable Text Controls in Latent Space with ODEs". arXiv(2022) [paper] [code]
- FAST : "FAST: Improving Controllability for Text Generation with Feedback Aware Self-Training". arXiv(2022) [paper]
- DisCup : "DisCup: Discriminator Cooperative Unlikelihood Prompt-tuning for Controllable Text Generation". EMNLP(2022) [paper] [code]
- MultiControl : "A Distributional Lens for Multi-Aspect Controllable Text Generation". EMNLP(2022) [paper] [code]
- NADO : "Controllable Text Generation with Neurally-Decomposed Oracle". NeurIPS(2022) [paper] [code]
- Mix-Match : "Mix and Match: Learning-free Controllable Text Generation using Energy Language Models". ACL(2022) [paper] [code]
- ControlPrefix : "Controllable Natural Language Generation with Contrastive Prefixes". ACL-Findings(2022) [paper]
- MUCOCO : "Controlled Text Generation as Continuous Optimization with Multiple Constraints". NeurIPS(2021) [paper] [code]
- DExperts : "DExperts: Decoding-Time Controlled Text Generation with Experts and Anti-Experts". ACL(2021) [paper] [code]
- FUDGE : "FUDGE: Controlled Text Generation With Future Discriminators". NAACL(2021) [paper] [code]
- GeDi : "GeDi: Generative Discriminator Guided Sequence Generation". EMNLP-Findings(2021) [paper] [code]
- GDC : "A Distributional Approach to Controlled Text Generation". ICLR(2021) [paper] [code]
- CoCon : "CoCon: A Self-Supervised Approach for Controlled Text Generation". ICLR(2021) [paper] [code]
- PPLM : "Plug and Play Language Models: A Simple Approach to Controlled Text Generation". ICLR(2020) [paper] [code]
- CTRL : "CTRL: A Conditional Transformer Language Model for Controllable Generation". arXiv(2019) [paper] [code]
? De volta ao topo
Text Planning
- CoScript : "Distilling Script Knowledge from Large Language Models for Constrained Language Planning". ACL(2023) [paper] [code]
- RSTGen : "RSTGen: Imbuing Fine-Grained Interpretable Control into Long-FormText Generators". NAACL(2022) [paper]
- Time Control : "Language Modeling via Stochastic Processes". ICLR(2022) [paper] [code]
- PLANET : "PLANET: Dynamic Content Planning in Autoregressive Transformers for Long-form Text Generation". ACL(2022) [paper]
- EventPlan : "Event Transition Planning for Open-ended Text Generation". ACL-Findings(2022) [paper] [code]
- CETP : "Knowledge-based Review Generation by Coherence Enhanced Text Planning". SIGIR(2021) [paper]
- PlanGen : "Plan-then-Generate: Controlled Data-to-Text Generation via Planning". EMNLP-Findings(2021) [paper] [code]
- DYPLOC : "DYPLOC: Dynamic Planning of Content Using Mixed Language Models for Text Generation". ACL(2021) [paper] [code]
- Tree-PLAN : "Infobox-to-text Generation with Tree-like Planning based Attention Network". IJCAI(2020) [paper]
- ProphetNet : "ProphetNet: Predicting Future N-gram for Sequence-to-Sequence Pre-training". EMNLP-Findings(2020) [paper] [code]
- PAIR : "PAIR: Planning and Iterative Refinement in Pre-trained Transformers for Long Text Generation". EMNLP(2020) [paper] [code]
- SentPlan : "Sentence-Level Content Planning and Style Specification for Neural Text Generation". EMNLP(2019) [paper] [code]
- PHVM : "Long and Diverse Text Generation with Planning-based Hierarchical Variational Model". EMNLP(2019) [paper] [code]
- TwinNet : "Twin Networks: Matching the Future for Sequence Generation". ICLR(2018) [paper] [code]
- PAG : "Plan, Attend, Generate: Planning for Sequence-to-Sequence Models". NIPS(2017) [paper]
? De volta ao topo
Decoding Algorithms
- Speculative Decoding : "Speculative Decoding: Exploiting Speculative Execution for Accelerating Seq2seq Generation". EMNLP-Findings(2023) [paper] [code]
- Medusa : "Medusa: Simple Framework for Accelerating LLM Generation with Multiple Decoding Heads". Github(2023) [Blog] [code]
- Lookahead Decoding : "Breaking the Sequential Dependency of LLM Inference Using Lookahead Decoding". LMSYS Org(2023) [Blog] [code]
- Speculative Sampling : "Accelerating Large Language Model Decoding with Speculative Sampling". arXiv(2023) [paper]
- Speculative Decoding : "Fast Inference from Transformers via Speculative Decoding". ICML(2023) [paper] [code]
- Parallel Decoding : "Accelerating Transformer Inference for Translation via Parallel Decoding". ACL(2023) [paper] [code]
- EAD : "The Stable Entropy Hypothesis and Entropy-Aware Decoding: An Analysis and Algorithm for Robust Natural Language Generation". arXiv(2023) [paper] [code]
- Contrastive Search : "Contrastive Search Is What You Need For Neural Text Generation". TMLR(2023) [paper] [code] [blog]
- Momentum Decoding : "Momentum Decoding: Open-ended Text Generation As Graph Exploration". arXiv(2022) [paper] [code]
- Crowd Sampling : "Follow the Wisdom of the Crowd: Effective Text Generation via Minimum Bayes Risk Decoding". arXiv(2022) [paper] [code]
- RankGen : "RankGen: Improving Text Generation with Large Ranking Models". EMNLP(2022) [paper] [code]
- Contrastive Decoding : "Contrastive Decoding: Open-ended Text Generation as Optimization". arXiv(2022) [paper] [code]
- COLD : "COLD Decoding: Energy-based Constrained Text Generation with Langevin Dynamics". NeurIPS(2022) [paper] [code]
- Lattice : "Massive-scale Decoding for Text Generation using Lattices". NAACL(2022) [paper] [code]
- KID : "Knowledge Infused Decoding". ICLR(2022) [paper] [code]
- NeuroLogic A*esque : "NeuroLogic A *esque Decoding: Constrained Text Generation with Lookahead Heuristics". NAACL(2022) [paper] [code]
- NeuroLogic : "NeuroLogic Decoding: (Un)supervised Neural Text Generation with Predicate Logic Constraints". NAACL(2021) [paper] [code]
- DeLorean : "Back to the Future: Unsupervised Backprop-based Decoding for Counterfactual and Abductive Commonsense Reasoning". EMNLP(2020) [paper] [code]
- Top-p (Nucleus) Sampling : "The Curious Case of Neural Text Degeneration". ICLR(2020) [paper] [code]
- BP Decoding : "Blockwise Parallel Decoding for Deep Autoregressive Models". NIPS(2018) [paper]
- Disjunctive Constraints : "Guided Generation of Cause and Effect". IJCAI(2020) [paper] [code-huggingface]
- CGMH : "CGMH: Constrained Sentence Generation by Metropolis-Hastings Sampling". AAAI(2019) [paper] [code]
- DBS : "Directed Beam Search: Plug-and-Play Lexically Constrained Language Generation". arXiv(2020) [paper] [code]
- DBA : "Fast Lexically Constrained Decoding with Dynamic Beam Allocation for Neural Machine Translation". NAACL(2018) [paper] [code-official] [code-fairseq]
- GBS : "Lexically Constrained Decoding for Sequence Generation Using Grid Beam Search". ACL(2017) [paper] [code]
? De volta ao topo
NLG Evaluation
- Survey : "Leveraging Large Language Models for NLG Evaluation: A Survey". arXiv(2024) [paper]
- BBScore : "BBScore: A Brownian Bridge Based Metric for Assessing Text Coherence". AAAI(2024) [paper]
- GPTEval : "GPTEval: NLG Evaluation using GPT-4 with Better Human Alignment". arXiv(2023) [paper]
- GPTScore : "GPTScore: Evaluate as You Desire". arXiv(2023) [paper] [code]
- RoMe : "RoMe: A Robust Metric for Evaluating Natural Language Generation". ACL(2022) [paper] [code]
- EAD : "Rethinking and Refining the Distinct Metric". ACL(2022) [paper] [code]
- MID : "Mutual Information Divergence: A Unified Metric for Multimodal Generative Models". NeurIPS(2022) [paper]
- DiscoScore : "DiscoScore: Evaluating Text Generation with BERT and Discourse Coherence". arXiv(2022) [paper] [code]
- CTC-Score : "Compression, Transduction, and Creation: A Unified Framework for Evaluating Natural Language Generation". EMNLP(2021) [paper] [code]
- BLEURT : "BLEURT: Learning Robust Metrics for Text Generation". ACL(2020) [paper] [code]
? De volta ao topo