Papierlese-Lesen-Konvai
Papierleseliste in der Konversations -KI, die hauptsächlich Dialogsysteme und natürliche Sprachgenerierung umfasst. Dieses Repository aktualisiert ständig? ...
- Tiefes Lernen in NLP
- Dialogsysteme
- Umfrage zum Dialog
- Konversations -LLMs
- Multimodaler Dialog
- Gelegener und verkörperter Dialog
- Visuell geweihter Dialog
- Proaktiver Dialog
- Miser. des proaktiven Dialogs
- Zielorientierter Dialog
- Nicht kollaborativer Dialog (Überzeugung und Verhandlung)
- Personalisierter Dialog
- Charakterbasierter Dialog
- Persönlichkeitsdialog
- Persona-basierter Dialog
- Emotionaler Dialog
- Emotionaler Unterstützung Dialog
- Einfühlsamer Dialog
- Empfehlungsdialog und CRS
- Dialog mit wissensgeschenktem Dialog
- Aufgabenorientierter Dialog
- Open-Domain-Dialog
- Langfristiger Dialog
- Antwortgenerierung
- Dialogbewertung
- Dialog Misc.
- Generation der natürlichen Sprache
- Umfrage zu NLG
- NLG -Theorien und -techniken
- Diffusionsmodelle für NLG
- Steuerbare Generation
- Textplanung
- Decodierungsalgorithmen
- NLG -Bewertung
Tiefes Lernen in NLP
- INLP : "Interaktive natürliche Sprachverarbeitung". ARXIV (2023) [Papier]
- Datenerweiterung : "Eine Umfrage zur Datenerweiterungsansätze für NLP". ACL-Findings (2021) [Papier]
- Aufforderung : "Pre-Training, Prompt und Predict: Eine systematische Übersicht über die Aufforderung zur Verarbeitung natürlicher Sprache". ARXIV (2021) [Papier]
- NLP World Scope : "Erleben Sie die Grundsprache". EMNLP (2020) [Papier]
- Transformator-XL : "Transformator-XL: aufmerksame Sprachmodelle jenseits eines Kontextes mit fester Länge". ACL (2019) [Papier] [Code]
- Transformator : "Aufmerksamkeit ist alles, was Sie brauchen". Neurips (2017) [Papier] [Code-official] [Code-TF] [Code-Py]
- VAE : "Eine Einführung in Variationsautoencoder". Arxiv (2019) [Papier]
- Umfrage zur Aufmerksamkeit : "Eine Einführungsumfrage zu Aufmerksamkeitsmechanismen bei NLP -Problemen". Arxiv (2018) [Papier]
- Additive Aufmerksamkeit : "Übersetzung der neuronalen maschinellen Übersetzung, indem Sie gemeinsam lernen, auszurichten und zu übersetzen". ICLR (2015) [Papier]
- Multiplikative Aufmerksamkeit : "Effektive Ansätze für aufmerksamkeitsbasierte neuronale maschinelle Übersetzung". EMNLP (2015) [Papier]
- Speichernetz : "End-to-End-Speicher-Netzwerke". Neurips (2015) [Papier]
- Kopiermechanismus (PGN) : "Gehen Sie zum Punkt: Zusammenfassung mit Zeigergenerator-Netzwerken". ACL (2017) [Papier] [Code]
- Kopiermechanismus : "Kopiermechanismus in Sequenz-zu-Sequenz-Lernen einbeziehen". ACL (2016) [Papier]
- Elmo : "Deep Contextualisierte Wortrepräsentationen". NAACl (2018) [Papier] [Code]
- Handschuh : "Handschuh: Globale Vektoren für Wortrepräsentation". EMNLP (2014) [Papier] [Code]
- Word2VEC Tutorial : "Word2VEC Parameterlernen erklärt". Arxiv (2016) [Papier]
- Multi-Task-Lernen : "Ein Überblick über das Lernen von Multitasking in tiefen neuronalen Netzwerken". Arxiv (2017) [Papier]
- Gradientenabstieg : "Ein Überblick über die Optimierungsalgorithmen für Gradientenabsteigungsoptimierung". Arxiv (2016) [Papier]
? Zurück nach oben
Dialogsysteme
Umfrage zum Dialog
- Datenerzeugung : "Eine Umfrage zu den jüngsten Fortschritten bei der Erzeugung von Konversationsdaten". Arxiv (2024) [Papier]
- Proaktiver Dialog : "Eine Umfrage zu proaktiven Dialogsystemen: Probleme, Methoden und Perspektiven". IJCAI (2023) [Papier]
- Verantwortlicher Dialog : "Jüngste Fortschritte zu sichern, verantwortungsbewussten und moralischen Dialogsystemen: Eine Umfrage". ARXIV (2023) [Papier]
- Verhandlungsdialog : "Verhandeln wir! Eine Umfrage über Verhandlungsdialogsysteme". Arxiv (2022) [Papier]
- DL-basierter Dialog : "Jüngste Fortschritte in Deep Learning-basierten Dialogsystemen: Eine systematische Umfrage". ARXIV (2021) [Papier]
- Open-Domain-Dialog : "Herausforderungen beim Aufbau intelligenter Open-Domain-Dialogsysteme". Tois (2020) [Papier]
- Dialogsysteme : "Eine Umfrage zu Dialogsystemen: Jüngste Fortschritte und neue Grenzen". Sigkdd Explorations (2017) [Papier]
- Dialogkorpora : "Eine Umfrage über verfügbare Korpora zum Aufbau datengesteuerter Dialogsysteme". Arxiv (2017) [Papier] [Daten]
? Zurück nach oben
Konversations -LLMs
- Papagei : "Papagei: Verbesserung von Chat-Modellen mit mehreren Turn-Chat, indem Sie lernen, Fragen zu stellen." ARXIV (2023) [Papier]
- Memochat : "Memochat: Tuning von LLMs, um Memos für eine konsistente Langstrecken-Open-Domain-Konversation zu verwenden". ARXIV (2023) [Papier]
- LAMA 2-CHAT : "Lama 2: Open Foundation und Feinabstimmung Chat-Modelle". Meta (2023) [Papier] [Code]
- CHATGLM3 : "CHATGLM3 -Serie: Öffnen Sie zweisprachige Chat -LLMs". Tsinghua (2023) [Code]
- CHATGLM2-6B : "CHATGLM2-6B: Ein offener zweisprachiger Chat-LLM". Tsinghua (2023) [Code]
- MPC : "forderte LLMs als Chatbot-Module für eine lange Gespräch mit offener Domänen auf". ACL-Findings (2023) [Papier] [Code]
- MemoryBank-Silicon-Freund : "MemoryBank: Verbesserung großer Sprachmodelle mit Langzeitgedächtnis". ARXIV (2023) [Papier] [Code]
- Ultrachat : "Verbesserung von Chat-Sprachmodellen durch Skalierung hochwertiger Unterrichtsgespräche". ARXIV (2023) [Papier] [Daten]
- Chatalpaca : "Chatalpaca: Ein Multi-Turn-Dialog-Corpus, das auf Alpaka-Anweisungen basiert". GitHub (2023) [Daten]
- Phoenix : "Phoenix: Demokratisierung von Chatgpt über Sprachen". ARXIV (2023) [Papier] [Code]
- Dolly : "Free Dolly: Einführung der ersten wirklich offenen LLM der Welt". Databricks (2023) [Code]
- Baize : "Baize: Ein Open-Source-Chat-Modell mit parametereffizientem Tuning auf Selbstversorgungsdaten". ARXIV (2023) [Papier] [Code]
- Vicuna : "Vicuna: Ein Open-Source-Chatbot, der GPT-4 mit 90% Chatgpt-Qualität beeindruckt". LMSYS org (2023) [Blog] [Code]
- Koala : "Koala: Ein Dialogmodell für die akademische Forschung". UC Berkeley (2023) [Blog] [Code]
- Belle : "Belle: Sei jeder aller Sprachmodell Engine". Lianjiatech (2023) [Code]
- ALPACA : "Alpaka: Ein starkes, reproduzierbares Anweisungsmodell". Stanford (2023) [Blog] [Code] [Alpaka-Lora]
- CHATGLM-6B : "Ein offenes zweisprachiges Dialogsprachmodell". Tsinghua (2023) [Code]
- Open-Assistant : "Open Assistant: Conversational AI für alle". GitHub (2023) [Projekt] [Code]
- CHATGPT : "CHATGPT: Sprachmodelle für den Dialog optimieren". OpenAI (2022) [Blog]
- Sparrow : "Verbesserung der Ausrichtung der Dialogagenten durch gezielte menschliche Urteile". ARXIV (2022) [Papier] [Daten]
- Blenderbot3 : "Blenderbot 3: Ein bereitgestellter Konversationsagent, der ständig lernt, sich verantwortungsbewusst zu engagieren". Arxiv (2022) [Papier]
- LAMDA : "LAMDA: Sprachmodelle für Dialoganwendungen". Arxiv (2022) [Papier]
- Godel : "Godel: Große Vorausbildung für zielgerichtetes Dialog". ARXIV (2022) [Papier] [Code]
- Anthropic Assistant-V2 : "Training eines hilfsbereiten und harmlosen Assistenten mit Verstärkungslernen durch menschliches Feedback". Arxiv (2022) [Papier]
- Anthropischer Assistent : "Ein allgemeiner Sprachassistent als Labor für die Ausrichtung". ARXIV (2021) [Papier]
? Zurück nach oben
Multimodaler Dialog
Gelegener und verkörperter Dialog
- SLL : "Großsprachige modellbasierte situative Dialoge zum Lernen der zweiten Sprache". Arxiv (2024) [Papier]
- Emb-Plan : "Multimodal verkörperter Plan-Vorhersage, der mit synthetischen verkörperten Dialog erweitert wurde". EMNLP (2023) [Papier]
- WTAG : "Können Foundation -Modelle, die Sie Schritt für Schritt beobachten, sprechen und leiten, um einen Kuchen zu machen?" EMNLP-Findings (2023) [Papier] [Code]
- SIMMC-VR : "SIMMC-VR: Ein aufgabenorientierter multimodaler Dialogdatensatz mit situierten und immersiven VR-Streams". ACL (2023) [Papier]
- Sicher : "Multimodalem Empfehlungsdialog mit subjektiver Präferenz: Eine neue Herausforderung und Benchmark". ACL (2023) [Papier] [Daten]
- Zucker : "Ein Textdatensatz für die proaktive Antwortauswahl". ACL (2023) [Papier] [Daten]
- Minddial : "Minddial: Glaubensdynamikverfolgung mit der medizinischen Modellierung der theoretischen Modellierung für die Generation des neuronalen Dialogs". ARXIV (2023) [Papier]
- Holoassist : "Holoassist: Ein egozentrischer Datensatz für menschliche Interaktion für interaktive AI -Assistenten in der realen Welt". ICCV (2023) [Papier] [Daten]
- Zusammenarbeit : "Auf dem Weg zur kollaborativen Plan durch Theorie der Mind -Modellierung im situierten Dialog". IJCAI (2023) [Papier] [Code]
- Alexa Arena : "Alexa Arena: Eine benutzerorientierte interaktive Plattform für verkörperte KI". ARXIV (2023) [Papier] [Code]
- Möwen : "Möwe: Ein verkörperter Wirkstoff für die Anleitung, die sich durch den situierten Dialog befolgt". Alexa Prize Simbot Challenge (2023) [Papier]
- Sitcom-Detr : "Auf welchen beziehen Sie sich im Dialog mit multimodaler Objekte". EACL-SRW (2023) [Papier] [Code]
- MLR : "Verbesserung von Konversationsmitteln mit Schritt-für-Schritt-multimodaler Logik-Argumentation". DSTC11 (2023) [Papier]
- SimpleMtod : "SimpleMtod: Ein einfaches Sprachmodell für einen multimodalen aufgabenorientierten Dialog mit symbolischer Szenenrepräsentation". ARXIV (2023) [Papier]
- Frühling : "Frühling: Gesprächsübergreifend mit multimodalen Fragen aus inkrementellem Layout -Diagramm". AAAI (2023) [Papier] [Code]
- Dorothie : "Dorothie: Gesprochener Dialog zum Umgang mit unerwarteten Situationen in interaktiven autonomen Fahrern". EMNLP-Findings (2022) [Papier] [Code]
- LICHTKRUPLICULUM : "Sundes Dialoglernen durch prozedurale Umweltgenerierung". ACL (2022) [Papier]
- Danli : "Danli: Beratungsagent für die folgenden Anweisungen für natürliche Sprache". EMNLP (2022) [Papier] [Code]
- PRS : "Lernen, Unterschiede auf die pragmatische Kommunikation zu vermitteln". ACL (2022) [Papier] [Code]
- Joint-Model : "Lernen, multimodale Kontexte für situierte Konversationsmittel einzubetten". Naacl-Findings (2022) [Papier] [Code]
- Teach_film : "Kopieren Sie den Lehrer nicht: Daten- und Modellherausforderungen im verkörperten Dialog". EMNLP (2022) [Papier] [Code]
- Teach : "Lehren: aufgabenbetriebene verkörperte Agenten, die Chat". AAAI (2022) [Papier] [Daten]
- Mindcraft : "Mindcraft: Theory of Mind -Modellierung für den situierten Dialog in kollaborativen Aufgaben". EMNLP (2021) [Papier] [Code]
- Multimodales Modell : "Multimodale Wechselwirkungen unter Verwendung von vorbereiteten unimodalen Modellen für SIMMC 2.0". DSTC10 (2022) [Papier] [Code]
- SIMMC 2.0 : "SIMMC 2.0: Ein aufgabenorientierter Dialogdatensatz für immersive multimodale Gespräche" EMNLP (2021) [Papier] [Code]
- MM-DST : "Multi-Task-Lernen für situierte Multi-Domänen-End-to-End-Dialogsysteme". ARXIV (2021) [Papier]
- SIMMC : "Standorte und interaktive multimodale Gespräche". Coling (2020) [Papier] [Code]
- Minecraft-Bap : "Lernen, Anweisungen in einem Minecraft-Dialog auszuführen". ACL (2020) [Papier] [Code]
- Cerealbar : "Ausführung von Anweisungen in situierten kollaborativen Interaktionen". EMNLP (2019) [Papier] [Code]
- Minecraft -Dialog : "Kollaborativer Dialog in Minecraft". ACL (2019) [Papier] [Code]
- CLG : "Kollaborative Sprachgrund für den situierten Human -Robot -Dialog". AI Magazine (2016) [Papier]
- SHRD : "Zurück zu den Blöcken Welt: Neue Handlungen durch den situierten Human-Robot-Dialog lernen". Sigdial (2014) [Papier]
Visuell geweihter Dialog
- Tiger : "Tiger: Ein einheitliches Generativmodell -Framework für die Erzeugung der multimodalen Dialogreaktion". Coling (2024). [Papier] [Code]
- Dialogcc : "Dialogcc: Eine automatisierte Pipeline zum Erstellen hochwertiger multimodaler Dialog-Datensatz". NAACl (2024) [Papier] [Daten]
- VLAW-MDM : "Ein Framework für Aufwärmaufgaben in Visionsprachen in multimodalen Dialogmodellen". EMNLP (2023) [Papier] [Code]
- ZRIGF : "ZRIGF: Ein innovativer multimodaler Rahmen für die Bildungsgenerierung von Null-Ressourcen-Bild". ACM MM (2023) [Papier] [Code]
- VDialog : "VDialogue: Ein einheitlicher Bewertungs-Benchmark für visuell gegründeten Dialog". ARXIV (2023) [Papier]
- Textbind : "textbind: multimodal multimodaler Anweisungen in der Wildnis". ARXIV (2023) [Papier] [Daten]
- VSTAR : "VSTAR: Ein Video-Dialog-Datensatz für ein Video für semantisches Verständnis mit Szene- und Themenübergängen". ACL (2023) [Papier] [Daten]
- COMSET : "Multimodale personenbasierte Generation von Comic -Dialogen". ACL (2023) [Papier] [Code]
- MPchat : "MPchat: Auf dem Weg zu multimodalem personenbezogenem Gespräch". ACL (2023) [Papier] [Code]
- Tempo : "Tempo: Einheitlicher multimodaler Dialog vor der Training mit progressiven und kompositorischen Experten". ACL (2023) [Papier] [Code]
- Mmdialog : "Mmdialog: Ein groß angelegter Multiturn-Dialog-Datensatz für die multimodale Gespräch mit offener Domänen". ACL (2023) [Papier] [Daten]
- MDS-S2 : "Dual semantisches Wissen komponierte multimodale Dialogsysteme". Sigir (2023) [Papier]
- Tiktalk : "Tiktalk: Ein multi-modaler Dialog-Datensatz für Real-World Chitchat". ARXIV (2023) [Papier] [Code]
- Champagner : "Champagner: Lernen reales Gespräch aus großen Webvideos". ARXIV (2023) [Papier] [Code]
- Mmchat : "Mmchat: Multi-Modal-Chat-Datensatz in den sozialen Medien". LREC (2022) [Papier] [Code]
- CRVD : "Kollaborative Argumentation zu multimodalen semantischen Graphen für die Videoerzeugung mit Video-Dialog". EMNLP-Findings (2022) [Papier]
- M3ED : "M3ED: Multi-Modal Multi-Szene Multi-Label Emotional Dialogue-Datenbank". ACL (2022) [Papier] [Daten]
- MDRG : "Multimodal Dialogue Response Generation". ACL (2022) [Papier]
- UNITRANSER : "Unitranser: Ein einheitliches semantisches Repräsentationsrahmen für multimodales aufgabenorientiertes Dialogsystem". ACL (2022) [Papier]
- Photochat : "Photochat: Ein menschlich-humanischer Dialogdatensatz mit dem Foto-Sharing-Verhalten für gemeinsame Bild-Text-Modellierung". ACL (2021) [Papier] [Daten]
- Multi-Modal-Dialog : "Konstruktion des multimodalen Dialogdatensatzes durch Ersetzen von Text durch semantisch relevante Bilder". ACL (2021) [Papier] [Code]
- OpenVidial 2.0 : "OpenVidial 2.0: Ein größerer Datensatz für Dialoggenerierung von Open-Domänen mit visuellen Kontexten". ARXIV (2021) [Papier] [Daten]
- Schatz : "Multimodales Dialogsystem: Relational Graph-basierte Kontextverständnis". ACM MM (2021) [Papier] [Code]
- MMCONV : "MMConv: Eine Umgebung für multimodale Konversationssuche über mehrere Domänen hinweg". Sigir (2021) [Papier] [Daten]
- Bild -Chat : "Image Chat: Engagieren geerdete Gespräche". ACL (2020) [Papier] [Daten]
- MTN : "Multimodale Transformer-Netzwerke für End-to-End-Video-Dialogsysteme". ACL (2019) [Papier] [Code]
- MELD : "MELD: Ein multimodaler Mehrparteien-Datensatz für die Emotionserkennung in Gesprächen". ACL (2019) [Papier] [Daten]
- Clevr-Dialog : "Clevr-Dialog: Ein diagnostischer Datensatz für mehrflüssige Argumentation im visuellen Dialog". NAACl (2019) [Papier] [Daten]
- Visdial-RL : "Verbesserung des generativen visuellen Dialogfelds durch Beantwortung verschiedener Fragen". EMNLP (2019) [Papier] [Code]
- Magie : "Multimodales Dialogsystem: Erzeugen von Antworten über adaptive Decoder". ACM MM (2019) [Papier] [Code]
- KMD : "Wissensbewusstes multimodales Dialogsystem". ACM MM (2018) [Papier]
- MMD : "Um multimodale, domänenbewusste Konversationssysteme auf dem Bauen von großem Maßstab zu bauen". AAAI (2018) [Papier] [Daten]
- Sprechen Sie den Spaziergang : "Sprechen Sie den Spaziergang: Navigieren von New York City durch einen geerdeten Dialog". Arxiv (2018) [Papier] [Code]
- IGC : "Image-gegründete Gespräche: Multimodaler Kontext für natürliche Frage und Antwortgenerierung". IJCNLP (2017) [Papier] [Daten]
- Visdial : "visueller Dialog". CVPR (2017) [Papier] [Daten]
? Zurück nach oben
Proaktiver Dialog
Miser. des proaktiven Dialogs
- DPDP : "Planung wie Mensch: Ein Doppelprozess-Rahmen für die Dialogplanung". ACL (2024) [Papier] [Code]
- PCA : "In Richtung menschlicher proaktiver Konversationsmittel". Sigir (2024) [Papier]
- Procot : "Aufforderung und Bewertung von großsprachigen Modellen für proaktive Dialoge: Klärung, zielgerichtete und Nicht-Kollaboration". EMNLP-Findings (2023) [Papier] [Code]
- Tutorial : "Zielbewusstsein für die Konversations-KI: Proaktivität, Nicht-Kollaborativität und darüber hinaus". ACL (2023) [Papier]
Zielorientierter Dialog
- PAI : "Auf dem Weg zu zielorientierten intelligenten Nachhilfesystemen in der Online-Bildung". ARXIV (2023) [Papier]
- Topdial : "Zielorientierte proaktive Dialogsysteme mit Personalisierung: Problemformulierung und Datensatzkuration". EMNLP (2023) [Papier] [Code]
- RTCP : "Verstärkte zielgesteuerte Konversationsförderung". EMNLP (2023) [Papier] [Code]
- MTGP : "MTGP: Multi-Turn-Ziel-orientierter Dialog, der vom generativen globalen Pfad mit flexiblen Wendungen geführt wird". ACL-Findings (2023) [Papier] [Code]
- Farbe : "Dialogplanung über Brownian Bridge Stochastischer Prozess für zielgerichtete proaktive Dialog". ACL-Findings (2023) [Papier] [Code]
- TOPKG : "TOPKG: Zielorientierter Dialog über globale Planung von Wissensgraphen". Coling (2022) [Papier] [Code]
- TGCP : "Ziel-geführte Gesprächsplanung von Open-Domain". Coling (2022) [Papier] [Code]
- FOP : "Langzeitkontrolle für die Erzeugung der Dialoge: Methoden und Bewertung". NAACl (2022) [Papier] [Code]
- CODA : "Ziellgeführte Dialogreaktionsgenerierung unter Verwendung von CommonSense und Datenerweiterung". Naacl-Findings (2022) [Papier] [Code]
- Otter : "Otter: One-Turn-Thema Übergänge für den Dialog mit offener Domänen". ACL (2021) [Papier] [Daten]
- CG-Nar : "Klar darüber nachdenken, schnell sprechen: Konzept gestaltete nicht autoregressive Generation für Open-Domain-Dialogsysteme". EMNLP (2021) [Papier] [Code]
- Duconv : "Proaktives Gespräch mit explizitem Gespräch". ACL (2019) [Papier] [Code]
- CKC : "Keyword-gesteuerte neuronale Konversationsmodell". AAAI (2021) [Papier] [Code]
- Know-TRL : "Wissensgrafik geerdete Zielplanung für die Erzeugung offener Domänen". AAAI (2020) [Papier]
- DKRN : "Dynamisches Knowledge Routing-Netzwerk für Ziel-Gespräch mit offener Domänen". AAAI (2020) [Papier] [Code]
- TGCONV : "Zielgesprächs mit offenem Open-Domain". ACL (2019) [Papier] [Code]
Nicht kollaborativer Dialog (Überzeugung und Verhandlung)
- Reise : "Stärke liegt in Unterschieden! In Richtung effektiver nicht kollaborativer Dialoge über maßgeschneiderte Strategieplanung". Arxiv (2024) [Papier]
- INA : "INA: Ein integrativer Ansatz zur Verbesserung der Verhandlungsstrategien mit Belohnungsdialogsystem". EMNLP (2023) [Papier] [Daten]
- I-pro : "Interaktion mit nicht kooperativem Benutzer: Ein neues Paradigma für die proaktive Dialogrichtlinie". Sigir (2022) [Papier]
- Paad : "Auf dem Weg zu einem fortschrittlichen autonomen Dialogagent". NAACl (2022) [Papier] [Code]
- Persrfi : "Verfeinern und nachahmen: Reduzierung der Wiederholung und Inkonsistenz in Überzeugungsdialogen durch Verstärkungslernen und menschliche Demonstration". EMNLP-Findings (2021) [Papier] [Code]
- Resper : "Ressper: rechnerisch modellierende Widerstandsstrategien in überzeugenden Gesprächen". EACL (2021) [Papier] [Code]
- ARDM : "Alternierendes wiederkehrendes Dialogmodell mit groß angelegten vorgebrachten Sprachmodellen". EACL (2021) [Papier] [Code]
- Dialographie : "Dialographie: Integration interpretierbarer Strategie-Graph-Netzwerke in Verhandlungsdialoge". ICLR (2021) [Papier] [Code]
- Verhandlungen : "Verbesserung der Dialogsysteme für die Verhandlung mit Persönlichkeitsmodellierung". ACL (2021) [Papier] [Code]
- Fehed : "Nicht collaborative Dialogsysteme mit explizitem semantischen und strategischen Dialoggeschichte". ICLR (2020) [Papier] [Code]
- CTX-PSA : "Lernen, separat für offene Dialogsysteme zu planen und zu realisieren". EMNLP-Findings (2020) [Papier] [Code]
- Verhandlungen-Coach : "Ein dynamischer Strategie-Coach für effektive Verhandlungen". Sigdial (2019) [Papier] [Code]
- PreduasionForGood : "Überzeugungsarbeit für immer: Auf dem Weg zu einem personalisierten überzeugenden Dialogsystem für soziales Gut". ACL (2019) [Papier] [Daten]
- Craigslistbargain : "Entkoppelungsstrategie und Generation in den Verhandlungsdialogen". EMNLP (2018) [Papier] [Daten]
? Zurück nach oben
Personalisierter Dialog
Charakterbasierter Dialog
- LLM-Werewolf : "Erforschen großer Sprachmodelle für Kommunikationsspiele: Eine empirische Studie über Werwolf". ARXIV (2023) [Papier]
- Chatharuhi : "Chatharuhi: Wiederbelebung des Anime -Charakters in der Realität über großes Sprachmodell". ARXIV (2023) [Bericht] [Code]
- DPCD : "Hi Sheldon! Erstellen Sie tiefe personalisierte Charaktere aus Fernsehsendungen". ARXIV (2023) [Papier] [Daten]
- Cornell-Rich : "Personalisierte Sprachmodellierung von Bildschirmzeichen mit reichen Metadatenanmerkungen". ARXIV (2023) [Papier] [Daten]
- Knudge : "Ontologisch treue Generation von Nicht-Spieler-Charakterdialogen". ARIC (2022) [Papier]
- HPD : "Großsprachige Models treffen Harry Potter: Ein zweisprachiger Datensatz zum Ausrichten von Dialogagenten mit Charakteren". ARXIV (2022) [Papier] [Daten]
- DIPISTORY : "Ein Benchmark für das Verständnis und die Erzeugung des Dialogs zwischen Charakteren in Geschichten". Arxiv (2022) [Papier]
- CareCall : "Aufbau einer Rolle des Open-Domain-Dialogsystems mit groß angelegten Sprachmodellen". NAACl (2022) [Papier] [Daten]
- PDP : "Treffen Sie Ihren Lieblingscharakter: Open-Domain-Chatbot, der fiktive Charaktere mit nur wenigen Äußerungen nachahmt". NAACl (2022) [Papier] [Code]
- RPA : "Bin ich ich oder du? Hochmoderne Dialogmodelle können keine Identität aufrechterhalten." Naacl-Findings (2022) [Papier]
- Charakterchat : "Charakterchat: Unterstützung der Erstellung fiktiver Charaktere durch Konversation und progressive Manifestation mit einem Chatbot". ACM C & C (2021) [Papier]
- Aloha : "Aloha: Künstliches Lernen menschlicher Attribute für Dialogagenten". AAAI (2020) [Papier] [Code]
- Licht : "Lernen, in einem Fantasy -Text -Abenteuerspiel zu sprechen und zu handeln". EMNLP (2019) [Papier] [Daten]
Persönlichkeitsdialog
- UBPL : "Anpassung von Persönlichkeitsmerkmalen in Großsprachenmodellen durch unbeaufsichtigte personalisierte Lexika". ARXIV (2023) [Papier]
- CharakterChat : "Charakterchat: Lernen für die Gesprächs -KI mit personalisierter sozialer Unterstützung". ARXIV (2023) [Papier] [Code]
- CHATGPT-MBTI : "Kann Chatgpt menschliche Persönlichkeiten bewerten? Ein allgemeiner Bewertungsrahmen". ARXIV (2023) [Papier] [Code]
- Veranlasste Persönlichkeit : "Kontrolle des Persönlichkeitsstils im Dialog mit null Schuss-Eingabeaufforderung-Lernen". IWSDS (2023) [Papier]
- CPED : "CPED: Ein groß angelegter chinesischer personalisierter und emotionaler Dialog-Datensatz für die KI der Konversation". ARXIV (2022) [Papier] [Daten]
- PELD : "Wählen Sie automatisch Emotionen für die Reaktion über die von Persönlichkeit betroffene Emotionsverlust". ACL-Findings (2021) [Papier] [Daten]
- FriendsPersona : "Automatische textbasierte Persönlichkeitserkennung von Monologen und Mehrparteien-Dialogen mit aufmerksamen Netzwerken und kontextbezogenen Einbettungen". AAAI-Student Abstract (2020) [Papier] [Daten]
- APR : "Identifizieren von Persönlichkeitsmerkmalen mithilfe der Überlappungsdynamik im Multiparty -Dialog". Interspeech (2019) [Papier]
- PersonalDilaog : "Personalisierte Dialoggenerierung mit diversifizierten Eigenschaften". Arxiv (2019) [Papier] [Daten]
- Personagenlg : "Kontrolle der personenbasierten stilistischen Variation mit neuronalen natürlichen Sprachgeneratoren". Sigdial (2018) [Papier] [Daten]
Persona-basierter Dialog
- Noten : "Commerdial: Commonsense PERSONAMED DIALOGUOGE DIALOGE DAILOGE UND Benchmark". Arxiv (2024) [Papier]
- IDL : "" In Dialogen lernen wir ": Auf dem Weg zu einem personalisierten Dialog ohne vordefinierte Profile durch In-Dialog-Lernen". Arxiv (2024) [Papier]
- Dialogicl : "Erstellen einer guten Eingabeaufforderung oder Bereitstellung von vorbildlichen Dialogen? Eine Studie über das Lernen in Kontext für personenbasierte Dialoggenerierung". Arxiv (2024) [Papier]
- Varmi : "Aufbau von Persönlichkeiten konsequente Dialogagenten mit Offline -Verstärkungslernen". EMNLP (2023) [Papier] [Code]
- Opela : "Wenn Crowd Persona trifft: Erstellen eines groß angelegten Personal-Dialogs Corpus mit offenem Domänen". ARXIV (2023) [Papier] [Daten]
- Orig : "Auf dem Weg zu einer robusten personalisierten Dialoggenerierung durch regelmäßige Bestelldarstellung" Repräsentation ". ACL-Findings (2023) [Papier] [Code]
- CLV : "Verbesserung der personalisierten Dialoggenerierung mit kontrastiven latenten Variablen: Kombinieren spärlicher und dichter Persona". ACL (2023) [Papier] [Code]
- SIMOAP : "SIMOAP: Verbesserung der Kohärenz und Konsistenz bei der persona-basierten Dialoggenerierung durch Überampling und Nachbewertung". ACL (2023) [Papier] [Code]
- LMedr : "Lernen zum Auswendiglernen und Diskursbeziehungen für personenkonsistente Dialoge". AAAI (2023) [Papier] [Code]
- Abruf-zu-Vorhersage : "Verbesserung der Persönlichkeitskonsistenz im Gespräch durch Persona, die sich verlängert". CIKM (2022) [Papier] [Code]
- Implizite Person : "Ein personalisierter Dialoggenerator mit implizitem Benutzerpersonenerkennung". Coling (2022) [Papier]
- CareCallMemory : "Halten Sie mich aktualisiert! Speicherverwaltung in langfristigen Gesprächen". EMNLP-Findings (2022) [Papier] [Daten]
- PersonAdeFense : "Sie kennen meine Lieblingsfarbe nicht: Verhindern, dass Dialogdarstellungen die privaten Personas der Sprecher enthüllen". NAACl (2022) [Papier] [Code]
- Eingabeaufgabe : "Erstellen eines personalisierten Dialogsystems mit promptem Abtum". NAACl-SRW (2022) [Papier]
- Dulemon : "Lange Zeit nicht sehen! Open-Domain-Gespräch mit Langzeitpersönlichkeitsgedächtnis". ACL-Findings (2022) [Papier] [Daten]
- Info : "Sie verstehen wirklich, was ich brauche: Intellektuelle und freundliche Dialog -Agenten, das Wissen und die Personala boden". EMNLP-Findings (2022) [Papier] [Code]
- Fokus : "Rufen Sie eine individuelle Konversation an: Customized Conversation Grounding Persona und Wissen". AAAI (2022) [Papier] [Code]
- MSP : "Weniger ist mehr: Lernen, die Dialoggeschichte für die personalisierte Dialoggenerierung zu verfeinern". NAACl (2022) [Papier]
- GME : "Übertragbare personenbezogene Dialoge über geerdete minimale Änderungen". EMNLP (2021) [Papier] [Code]
- Bob : "Bob: Bert Over Bert für personenbasierte Dialogmodelle aus begrenzten personalisierten Daten". ACL (2021) [Papier] [Code]
- PABST : "Unüberwachte Anreicherung des personenbezogenen Dialogs mit Hintergrundgeschichten". ACL (2021) [Papier] [Code]
- DHAP : "Ein Chatbot pro Person: Erstellen personalisierter Chatbots basierend auf impliziten Benutzerprofilen". Sigir (2021) [Papier]
- Pchatbot : "pchatbot: ein groß angelegter Datensatz für personalisiertes Chatbot". Sigir (2021) [Papier] [Daten]
- Compac : "Wie Wandern? Sie genießen wahrscheinlich die Natur: Persönlich gegründeter Dialog mit Gewerbenweiterungen". EMNLP (2020) [Papier] [Code]
- Pragmatische Konsistenz : "Werde ich wie ich klingen? Verbesserung der Persona-Konsistenz in Dialogen durch pragmatisches Selbstbewusstsein". EMNLP (2020) [Papier] [Code]
- XPersona : "Xpersona: Bewertung mehrsprachiger personalisierter Chatbot". ARXIV (2020) [Papier] [Daten]
- KVPI : "Profilkonsistenzidentifikation für Open-Domain-Dialogagenturen". EMNLP (2020) [Papier] [Code]
- DDR : "Generieren, Löschen und Umschreiben: Ein dreistufiges Rahmen zur Verbesserung der Persönlichkeitskonsistenz der Dialoggenerierung". ACL (2020) [Papier]
- P^2BOT : "Du beeindruckt mich: Dialoggenerierung über gegenseitige Persönlichkeitswahrnehmung". ACL (2020) [Papier] [Code]
- RCDG : "Erzeugen von persönlichen konsistenten Dialogen durch Nutzung der Inferenz für natürliche Sprache". AAAI (2020) [Papier] [Code]
- Personasparse : "Ein personalisiertes Modell der personalisierten Dialoggenerierung mit Persona-Parse-Daten". AAAI (2020) [Papier]
- Personawae : "Modellierung der Personalisierung im kontinuierlichen Raum für die Reaktionsgenerierung durch Augmented Wasserstein Autoencoder". EMNLP (2019) [Papier]
- PAML : "Personalisierung von Dialogagenten durch Meta-Learning". ACL (2019) [Papier] [Code]
- Personachat : "Personalisierung von Dialogagenten: Ich habe einen Hund, haben Sie auch Haustiere?" ACL (2018) [Papier] [Daten]
- PCCM : "Persönlichkeit/Profil zu einer Chat -Maschine für die kohärente Konversationsgenerierung zuweisen". IJCAI (2018) [Papier]
? Zurück nach oben
Emotionaler Dialog
Emotionaler Unterstützung Dialog
- Präferenzverzerrung : "Können große Sprachmodelle ein guter emotionaler Unterstützer sein? ACL (2024) [Papier]
- Escot : "Escot: Auf dem Weg zu interpretierbaren emotionalen Dialogsystemen". ACL (2024) [Papier] [Code]
- Muffin : "Muffin: Minderung der Unausfänglichkeit in emotionalen Unterstützung Gespräche mit vielfältigem KI -Feedback". ACL-Findings (2024) [Papier] [Code]
- DDRCU : "Dynamisches Demonstrationsabruf und kognitives Verständnis für emotionale Unterstützungsgespräche". Sigir (2024) [Papier] [Code]
- KEMI : "Wissensverstärktes Mischinitiativ-Dialogsystem für emotionale Unterstützungsgespräche". ACL (2023) [Papier] [Code]
- CSCONV : "Ein kognitives Stimulationsdialogsystem mit Multi-Source-Wissensfusion für Älteste mit kognitiver Beeinträchtigung". ACL (2023) [Papier] [Code]
- Augesc : "Augesc: Dialoger Augmentation mit großen Sprachmodellen für emotionale Unterstützungsgespräche". ACL-Findings (2023) [Papier]
- TransSc : "Transc: Gespräch mit emotionaler Unterstützung über den Übergang des Zustands auf runden Ebene". ACL-Findings (2023) [Papier] [Code]
- PAL : "PAL: PERSONALA-AUTMOTIONISCHE SUPPOTION UNTERNEHMEN ENGENSCHAFT". ACL-Findings (2023) [Papier] [Code]
- MultiesC : "Verbesserung der Dialoggenerierung von emotionalen Unterstützung mit mehreren Geschäften mit der Planung der Lookahead-Strategie". EMNLP (2022) [Papier] [Code]
- Misc : "Misc: Ein gemischtes Strategie-bewusstes Modell, das den Kometen für emotionale Support-Konversation integriert". ACL (2022) [Papier] [Code]
- C3KG : "C3KG: Eine chinesische Konversationskenntnisgrafik". ACL-Findings (2022) [Papier] [Daten]
- GLHG : "Global kontrollieren, lokal verstehen: Ein globales hierarchisches Graph-Netzwerk für emotionale Unterstützung bei der Konversation." IJCAI (2022) [Papier]
- Esconv : "Auf dem Weg zu emotionalen Dialogsystemen". ACL (2021) [Papier] [Daten]
Einfühlsamer Dialog
- Stickerconv : "Stickerconv: Erzeugen von multimodalen einfühlsamen Reaktionen von Grund auf". ACL (2024) [Papier] [Daten]
- Wahrnehmung : "Sprechen Sie mit menschlichen Agenten: einfühlsamer Dialog durch wahrnehmbare akustische Empfang und Reaktion". ACL (2024) [Papier] [Code]
- E-Core : "E-Core: Emotionskorrelation verbessert die einfühlsame Dialoggenerierung" EMNLP (2023) [Papier]
- EMPSOA : "Verliere dich nicht! Einfühlsame Reaktionserzeugung durch explizites selbstderes Bewusstsein". ACL-Findings (2023) [Papier] [Code]
- Fall : "Fall: Ausrichten von grob-zu-Fine-Erkenntnissen und Zuneigung zur Einfühlungsreaktionsgenerierung". ACL (2023) [Papier] [Code]
- Pflege : "Fürsorge: Kausalitätsbegründung für einfühlsame Reaktionen durch die Erzeugung von Bedingungen". EMNLP-Findings (2022) [Papier] [Code]
- EMPGPT-3 : "Erzeugt GPT-3 empathische Dialoge? Eine neuartige In-Kontext-Beispielauswahlmethode und automatische Evaluierungsmetrik für einfühlsame Dialoggenerierung." Coling (2022) [Papier] [Code]
- Posemodial : "Auf dem Weg zu Multiturn-Empathetic Dialogen mit positiver Emotionserklärung". Arxiv (2022) [Papier]
- CEM : "CEM: Commonsense-Sense-Sense-Empathetic Response Generation". AAAI (2022) [Papier] [Code]
- Gee : "Perspektiven und Pragmatiker zur Erzeugung einfühlsamer Reaktionen, die sich auf Emotionen konzentrieren". EMNLP (2021) [Papier] [Code]
- ReCEC : "Verbesserung der einfühlsamen Reaktionsgenerierung durch Erkennen von Emotionen in Gesprächen". EMNLP-Findings (2021) [Papier] [Code]
- Comae : "Comae: Ein multifaktor hierarchischer Rahmen für die Erzeugung der empathischen Reaktion". ACL-Findings (2021) [Papier] [Code]
- Pflege : "Fürsorge: Commonsense-bewusstes emotionale Reaktionsgenerierung mit latenten Konzepten". AAAI (2021) [Papier] [Code]
- EMPDG : "EMPDG: Mehrauflösung interaktive einfühlsame Dialoggenerierung". Coling (2020) [Papier] [Code]
- MIME : "MIME: Nachahmung von Emotionen für die Erzeugung der einfühlsamen Reaktion". EMNLP (2020) [Papier] [Code]
- PEC : "Auf personenbasierten einfühlsamen Konversationsmodellen". EMNLP (2020) [Papier] [Code]
- Moel : "Moel: Mischung von einfühlsamen Zuhörern". EMNLP (2019) [Papier] [Code]
- Empatheticdialogues : "In Richtung einfühlsamer Gesprächsmodelle mit offener Domänen: Ein neuer Benchmark und Datensatz". ACL (2019) [Papier] [Daten]
- Emods : "Reaktionen mit einer bestimmten Emotion im Dialog erzeugen". ACL (2019) [Papier]
- Mojitalk : "Mojitalk: Erzeugen emotionaler Reaktionen im Maßstab". ACL (2018) [Papier]
- ECM : "Emotionale Chatsmaschine: Emotionale Konversationserzeugung mit internem und externem Gedächtnis". AAAI (2018) [Papier] [Code]
? Zurück nach oben
Empfehlungsdialog und CRS
- TCP-DIAL : "Folgen Sie mir: Konversationsplanung für zielgesteuerte Empfehlungsdialogsysteme". ARXIV (2022) [Papier] [Code]
- KERS : "KERS: Ein Wissensrahmen für Empfehlungsdialogsysteme mit mehreren Subläufen." EMNLP-Findings (2021) [Papier] [Code]
- Durecdial2.0 : "Durecdial 2.0: Ein zweisprachiger paralleler Korpus für die Konversationsempfehlung". EMNLP (2021) [Papier] [Code]
- Durecdial : "Auf dem Weg zu Gesprächsempfehlung über Dialoge mit mehreren Typen". ACL (2020) [Papier] [Code]
- TG-Redial : "Auf demsen themengesteuerte Konversationsempfehlungssystem". Coling (2020) [Papier] [Code]
- Inspiriert : "Inspiriert: Auf dem Weg zu geselligen Empfehlungsdialogsystemen". EMNLP (2020) [Papier] [Daten]
- GORECDIAL : "Empfehlung als Kommunikationsspiel: Selbsterbotbares Bot-Play für zielorientierte Dialog". EMNLP (2019) [Papier] [Code]
- CRS-Survey : "Eine Umfrage zu Konversationsempfehlungssystemen". ACM Computing -Umfragen (2021) [Papier]
- CRS-Survey : "Fortschritte und Herausforderungen in Konversationsempfehlungssystemen: Eine Umfrage". ARXIV (2021) [Papier]
- CRSLAB : "CRSLAB: Ein Open-Source-Toolkit zum Aufbau von Konversationsempfehlungssystemen". ARXIV (2021) [Papier] [Code]
- Mese : "Verbesserung der Qualität der Konversationsempfehlungssysteme mit kontextbewussten Element-Meta-Informationen". NAACl (2022) [Papier] [Code]
- C2-CRS : "C2-CRS: Grob-zu-Fine-kontrastives Lernen für Konversationsempfehlungssysteme". WSDM (2022) [Papier] [Code]
- BotPlay : "Self-Supervised Bot Play for Conversational Recommendation with Justifications". arXiv(2021) [paper]
- RID : "Finetuning Large-Scale Pre-trained Language Models for Conversational Recommendation with Knowledge Graph". arXiv(2021) [paper] [code]
- CRFR : "CRFR: Improving Conversational Recommender Systems via Flexible Fragments Reasoning on Knowledge Graphs". EMNLP(2021) [paper]
- NTRD : "Learning Neural Templates for Recommender Dialogue System". EMNLP(2021) [paper] [code]
- CR-Walker : "CR-Walker: Tree-Structured Graph Reasoning and Dialog Acts for Conversational Recommendation". EMNLP(2021) [paper] [code]
- RevCore : "RevCore: Review-augmented Conversational Recommendation". ACL-Findings(2021) [paper] [code]
- KECRS : "KECRS: Towards Knowledge-Enriched Conversational Recommendation System". arXiv(2021) [paper]
- FPAN : "Adapting User Preference to Online Feedback in Multi-round Conversational Recommendation". WSDM(2021) [paper] [code]
- UNICORN : "Unified Conversational Recommendation Policy Learning via Graph-based Reinforcement Learning". SIGIR(2021) [paper] [code]
- KGSF : "Improving Conversational Recommender Systems via Knowledge Graph based Semantic Fusion". KDD(2020) [paper] [code]
- CPR : "Interactive Path Reasoning on Graph for Conversational Recommendation". KDD(2020) [paper] [code]
- EAR : "Estimation-Action-Reflection: Towards Deep Interaction Between Conversational and Recommender Systems". WSDM(2020) [paper] [code]
- KBRD : "Towards Knowledge-Based Recommender Dialog System". EMNLP(2019) [paper] [code]
- ReDial : "Towards Deep Conversational Recommendations". NeurIPS(2018) [paper] [data]
? Zurück nach oben
Knowledge-grounded Dialogue
- DOCTOR : "Dialogue Chain-of-Thought Distillation for Commonsense-aware Conversational Agents". EMNLP(2023) [paper] [code] [demo]
- GATE : "Well Begun is Half Done: Generator-agnostic Knowledge Pre-Selection for Knowledge-Grounded Dialogue". EMNLP(2023) [paper] [code]
- CONNER : "Beyond Factuality: A Comprehensive Evaluation of Large Language Models as Knowledge Generators". EMNLP(2023) [paper] [code]
- K-DIAL : "Improving Factual Consistency for Knowledge-Grounded Dialogue Systems via Knowledge Enhancement and Alignment". EMNLP-Findings(2023) [paper]
- GLM-Dialog : "GLM-Dialog: Noise-tolerant Pre-training for Knowledge-grounded Dialogue Generation". arXiv(2023) [paper] [code]
- RHO : "RHO (ρ): Reducing Hallucination in Open-domain Dialogues with Knowledge Grounding". ACL-Findings(2023) [paper] [code]
- MultiRefKGC : "There Is No Standard Answer: Knowledge-Grounded Dialogue Generation with Adversarial Activated Multi-Reference Learning". EMNLP(2022) [paper] [code]
- CorefDiffs : "CorefDiffs: Co-referential and Differential Knowledge Flow in Document Grounded Conversations". COLING(2022) [paper] [code]
- DTR : "Stylized Knowledge-Grounded Dialogue Generation via Disentangled Template Rewriting". NAACL(2022) [paper] [code]
- XDAI : "XDAI: A Tuning-free Framework for Exploiting Pre-trained Language Models in Knowledge Grounded Dialogue Generation". KDD(2022) [paper] [code]
- PersonaKGC : "There Are a Thousand Hamlets in a Thousand People's Eyes: Enhancing Knowledge-grounded Dialogue with Personal Memory". ACL(2022) [paper] [code]
- KI : "Lexical Knowledge Internalization for Neural Dialog Generation". ACL(2022) [paper] [code]
- DiffKG : "Towards Large-Scale Interpretable Knowledge Graph Reasoning for Dialogue Systems". ACL-Findings(2022) [paper] [code]
- KSAM : "KSAM: Infusing Multi-Source Knowledge into Dialogue Generation via Knowledge Source Aware Multi-Head Decoding". ACL-Findings(2022) [paper]
- MDSP : "Multi-Stage Prompting for Knowledgeable Dialogue Generation". ACL-Findings(2022) [paper] [code]
- FSB : "Few-Shot Bot: Prompt-Based Learning for Dialogue Systems". arXiv(2021) [paper] [code]
- P-GDG : "Exploring Prompt-based Few-shot Learning for Grounded Dialog Generation". arXiv(2021) [paper]
- KAT-TSLF : "A Three-Stage Learning Framework for Low-Resource Knowledge-Grounded Dialogue Generation". EMNLP(2021) [paper] [code]
- DIALKI : "DIALKI: Knowledge Identification in Conversational Systems through Dialogue-Document Contextualization". EMNLP(2021) [paper] [code]
- CoLV : "CoLV: A Collaborative Latent Variable Model for Knowledge-Grounded Dialogue Generation". EMNLP(2021) [paper]
- SKT-KG : "Augmenting Knowledge-grounded Conversations with Sequential Knowledge Transition". NAACL(2021) [paper]
- MSKE : "More is Better: Enhancing Open-Domain Dialogue Generation via Multi-Source Heterogeneous Knowledge". EMNLP(2021) [paper] [code]
- EARL : "EARL: Informative Knowledge-Grounded Conversation Generation with Entity-Agnostic Representation Learning". EMNLP(2021) [paper] [code]
- KGD-CF : "Increasing Faithfulness in Knowledge-Grounded Dialogue with Controllable Features". ACL(2021) [paper]
- SECE : "Space Efficient Context Encoding for Non-Task-Oriented Dialogue Generation with Graph Attention Transformer". ACL(2021) [paper] [code]
- MIKe : "Initiative-Aware Self-Supervised Learning for Knowledge-Grounded Conversations". SIGIR(2021) [paper] [code]
- GOKC : "Learning to Copy Coherent Knowledge for Response Generation". AAAI(2021) [paper] [code]
- KnowledGPT : "Knowledge-Grounded Dialogue Generation with Pre-trained Language Models". EMNLP(2020) [paper] [code]
- DiffKS : "Difference-aware Knowledge Selection for Knowledge-grounded Conversation Generation". EMNLP-Findings(2020) [paper] [code]
- DukeNet : "DukeNet: A Dual Knowledge Interaction Network for Knowledge-Grounded Conversation". SIGIR(2020) [paper] [code]
- CCN : "Cross Copy Network for Dialogue Generation". EMNLP(2020) [paper] [code]
- PIPM : "Bridging the Gap between Prior and Posterior Knowledge Selection for Knowledge-Grounded Dialogue Generation". EMNLP(2020) [paper]
- ConceptFlow : "Grounded Conversation Generation as Guided Traverses in Commonsense Knowledge Graphs". ACL(2020) [paper] [code]
- ConKADI : "Diverse and Informative Dialogue Generation with Context-Specific Commonsense Knowledge Awareness". ACL(2020) [paper] [code]
- KIC : "Generating Informative Conversational Response using Recurrent Knowledge-Interaction and Knowledge-Copy". ACL(2020) [paper]
- SKT : "Sequential Latent Knowledge Selection for Knowledge-Grounded Dialogue". ICLR(2020) [paper] [code]
- KdConv : "KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn Knowledge-driven Conversation". ACL(2020) [paper] [data]
- TransDG : "Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering". AAAI(2020) [paper] [code]
- RefNet : "RefNet: A Reference-aware Network for Background Based Conversation". AAAI(2020) [paper] [code]
- GLKS : "Thinking Globally, Acting Locally: Distantly Supervised Global-to-Local Knowledge Selection for Background Based Conversation". AAAI(2020) [paper] [code]
- AKGCM : "Knowledge Aware Conversation Generation with Explainable Reasoning over Augmented Graphs". EMNLP(2019) [paper] [code]
- DyKgChat : "DyKgChat: Benchmarking Dialogue Generation Grounding on Dynamic Knowledge Graphs". EMNLP(2019) [paper] [code]
- OpenDialKG : "OpenDialKG: Explainable Conversational Reasoning with Attention-based Walks over Knowledge Graphs". ACL(2019) [paper] [data]
- WoW : "Wizard of Wikipedia: Knowledge-Powered Conversational agents". ICLR(2019) [paper]
- PostKS : "Learning to Select Knowledge for Response Generation in Dialog Systems". IJCAI(2019) [paper] [code-1] [code-2]
- NKD : "Knowledge Diffusion for Neural Dialogue Generation". ACL(2018) [paper] [data]
- Dual Fusion : "Smarter Response with Proactive Suggestion: A New Generative Neural Conversation Paradigm". IJCAI(2018) [paper]
- CCM : "Commonsense Knowledge Aware Conversation Generation with Graph Attention". IJCAI(2018) [paper] [code-tf] [code-py]
- MTask : "A Knowledge-Grounded Neural Conversation Model". AAAI(2018) [paper]
- GenDS : "Flexible End-to-End Dialogue System for Knowledge Grounded Conversation". arXiv(2017) [paper]
? Zurück nach oben
Task-oriented Dialogue
- P-ToD : "Personalizing Task-oriented Dialog Systems via Zero-shot Generalizable Reward Function". CIKM(2022) [paper]
- Dialogic : "Dialogic: Controllable Dialogue Simulation with In-Context Learning". EMNLP-Findings(2022) [paper] [code]
- KB-Adapter : "Injecting Domain Knowledge in Language Models for Task-Oriented Dialogue Systems". EMNLP(2022) [paper] [code]
- TacoBot : "Bootstrapping a User-Centered Task-Oriented Dialogue System". Proceedings of Alexa Prize TaskBot(2021) [paper]
- USDA : "User Satisfaction Estimation with Sequential Dialogue Act Modeling in Goal-oriented Conversational Systems". WWW(2022) [paper] [code]
- USS : "Simulating User Satisfaction for the Evaluation of Task-oriented Dialogue Systems". SIGIR(2021) [paper] [data]
- NS-Dial : "An Interpretable Neuro-Symbolic Reasoning Framework for Task-Oriented Dialogue Generation". ACL(2022) [paper] [code]
- GALAXY : "GALAXY: A Generative Pre-trained Model for Task-Oriented Dialog with Semi-Supervised Learning and Explicit Policy Injection". AAAI(2022) [paper] [code]
- PPTOD : "Multi-Task Pre-Training for Plug-and-Play Task-Oriented Dialogue System". arXiv(2021) [paper] [code]
- ToDCL : "Continual Learning in Task-Oriented Dialogue Systems". EMNLP(2021) [paper] [code]
- IR-Net : "Intention Reasoning Network for Multi-Domain End-to-end Task-Oriented Dialogue". EMNLP(2021) [paper]
- HyKnow : "HyKnow: End-to-End Task-Oriented Dialog Modeling with Hybrid Knowledge Management". ACL-Findings(2021) [paper] [code]
- DDMN : "Dual Dynamic Memory Network for End-to-End Multi-turn Task-oriented Dialog Systems". COLING(2020) [paper] [code]
- ToD-BERT : "ToD-BERT: Pre-trained Natural Language Understanding for Task-Oriented Dialogues". EMNLP(2020) [paper] [code]
- GraphDialog : "GraphDialog: Integrating Graph Knowledge into End-to-End Task-Oriented Dialogue Systems". EMNLP(2020) [paper] [code]
- MARCO : "Multi-Domain Dialogue Acts and Response Co-Generation". ACL(2020) [paper] [code]
- DF-Net : "Dynamic Fusion Network for Multi-Domain End-to-end Task-Oriented Dialog". ACL(2020) [paper] [code]
- MALA : "MALA: Cross-Domain Dialogue Generation with Action Learning". AAAI(2020) [paper]
- SGD : "Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset". AAAI(2020) [paper] [data]
- CrossWOZ : "CrossWOZ: A Large-Scale Chinese Cross-Domain Task-Oriented Dialogue Dataset". TACL(2020) [paper] [code]
- MultiWOZ : "MultiWOZ - A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling". EMNLP(2018) [paper] [code]
- Neural Task-Oriented Dialogue : "Learning to Memorize in Neural Task-Oriented Dialogue Systems". MPhil Thesis(2019) [paper]
- GLMP : "Global-to-local Memory Pointer Networks for Task-Oriented Dialogue". ICLR(2019) [paper] [code]
- KB Retriever : "Entity-Consistent End-to-end Task-Oriented Dialogue System with KB Retriever". EMNLP(2019) [paper] [data]
- TRADE : "Transferable Multi-Domain State Generator for Task-Oriented Dialogue Systems". ACL(2019) [paper] [code]
- WMM2Seq : "A Working Memory Model for Task-oriented Dialog Response Generation". ACL(2019) [paper]
- Pretrain-Fine-tune : "Training Neural Response Selection for Task-Oriented Dialogue Systems". ACL(2019) [paper] [data]
- Multi-level Mem : "Multi-Level Memory for Task Oriented Dialogs". NAACL(2019) [paper] [code]
- BossNet : "Disentangling Language and Knowledge in Task-Oriented Dialogs ". NAACL(2019) [paper] [code]
- SDN : "Subgoal Discovery for Hierarchical Dialogue Policy Learning". EMNLP(2018) [paper]
- D3Q : "Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning". EMNLP(2018) [paper] [code]
- DDQ : "Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning". ACL(2018) [paper] [code]
- MAD : "Memory-augmented Dialogue Management for Task-oriented Dialogue Systems". TOIS(2018) [paper]
- TSCP : "Sequicity: Simplifying Task-oriented Dialogue Systems with Single Sequence-to-Sequence Architectures". ACL(2018) [paper] [code]
- Mem2Seq : "Mem2Seq: Effectively Incorporating Knowledge Bases into End-to-End Task-Oriented Dialog Systems". ACL(2018) [paper] [code]
- Topic-Seg-Label : "A Weakly Supervised Method for Topic Segmentation and Labeling in Goal-oriented Dialogues via Reinforcement Learning". IJCAI(2018) [paper] [code]
- AliMe : "AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine". ACL(2017) [paper]
- KVR Net : "Key-Value Retrieval Networks for Task-Oriented Dialogue". SIGDIAL(2017) [paper] [data]
? Zurück nach oben
Open-domain Dialogue
Long-term Dialogue
- THEANINE : "THEANINE: Revisiting Memory Management in Long-term Conversations with Timeline-augmented Response Generation". arXiv(2024) [paper]
- LD-Agent : "Hello Again! LLM-powered Personalized Agent for Long-term Dialogue". arXiv(2024) [paper] [code]
- CPD : "Position Debiasing Fine-Tuning for Causal Perception in Long-Term Dialogue". IJCAI(2024) [paper]
- TemporalMemory : "Toward Conversational Agents with Context and Time Sensitive Long-term Memory". arXiv(2024) [paper] [data]
- LoCoMo : "Evaluating Very Long-Term Conversational Memory of LLM Agents". ACL(2024) [paper] [data]
- Conversation Chronicles : "Conversation Chronicles: Towards Diverse Temporal and Relational Dynamics in Multi-Session Conversations". EMNLP(2023) [paper] [data]
- GapChat : "Mind the Gap Between Conversations for Improved Long-Term Dialogue Generation". EMNLP-Findings(2023) [paper] [data]
- UniMC : "UniMC: A Unified Framework for Long-Term Memory Conversation via Relevance Representation Learning". arXiv(2023) [paper]
- RS : "Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models". arXiv(2023) [paper]
- MSC : "Beyond Goldfish Memory: Long-Term Open-Domain Conversation". ACL(2022) [paper] [data]
Response Generation
- Overview : "Open-domain Dialogue Generation: What We Can Do, Cannot Do, And Should Do Next". ACL-NLP4ConvAI(2022) [paper]
- Chirpy Cardinal : "Neural Generation Meets Real People: Building a Social, Informative Open-Domain Dialogue Agent". SIGDIAL(2022) [paper] [code] [project]
- TIL : "Towards Efficient Dialogue Pre-training with Transferable and Interpretable Latent Structure". EMNLP(2022) [paper]
- ProphetChat : "ProphetChat: Enhancing Dialogue Generation with Simulation of Future Conversation". ACL(2022) [paper]
- DialoFlow : "Conversations Are Not Flat: Modeling the Dynamic Information Flow across Dialogue Utterances". ACL(2021) [paper] [code]
- DiSCoL : "DiSCoL: Toward Engaging Dialogue Systems through Conversational Line Guided Response Generation". NAACL(2021) [paper] [code]
- DialogBERT : "DialogBERT: Discourse-Aware Response Generation via Learning to Recover and Rank Utterances". AAAI(2021) [paper]
- BlenderBot : "Recipes for Building an Open-Domain Chatbot". EACL(2021) [paper] [code]
- CDial-GPT : "A Large-Scale Chinese Short-Text Conversation Dataset". NLPCC(2020) [paper] [code]
- DialoGPT : "DialoGPT : Large-Scale Generative Pre-training for Conversational Response Generation". ACL(2020) [paper] [code]
- CG-Policy : "Conversational Graph Grounded Policy Learning for Open-Domain Conversation Generation". ACL(2020) [paper]
- PLATO-XL : "PLATO-XL: Exploring the Large-scale Pre-training of Dialogue Generation". arXiv(2021) [paper] [code]
- PLATO-2 : "PLATO-2: Towards Building an Open-Domain Chatbot via Curriculum Learning". ACL-Findings(2021) [paper] [code]
- PLATO : "PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable". ACL(2020) [paper] [code]
- Guyu : "An Empirical Investigation of Pre-Trained Transformer Language Models for Open-Domain Dialogue Generation". arXiv(2020) [paper] [code]
- CL4Dialogue : "Group-wise Contrastive Learning for Neural Dialogue Generation". EMNLP-Findings(2020) [paper] [code]
- Neg-train : "Negative Training for Neural Dialogue Response Generation". ACL(2020) [paper] [code]
- HDSA : "Semantically Conditioned Dialog Response Generation via Hierarchical Disentangled Self-Attention". ACL(2019) [paper] [code]
- CAS : "Skeleton-to-Response: Dialogue Generation Guided by Retrieval Memory". NAACL(2019) [paper] [code]
- Edit-N-Rerank : "Response Generation by Context-aware Prototype Editing". AAAI(2019) [paper] [code]
- HVMN : "Hierarchical Variational Memory Network for Dialogue Generation". WWW(2018) [paper] [code]
- XiaoIce : "The Design and Implementation of XiaoIce, an Empathetic Social Chatbot". arXiv(2018) [paper]
- D2A : "Dialog-to-Action: Conversational Question Answering Over a Large-Scale Knowledge Base". NeurIPS(2018) [paper] [code]
- DAIM : "Generating Informative and Diverse Conversational Responses via Adversarial Information Maximization". NeurIPS(2018) [paper]
- REASON : "Dialog Generation Using Multi-turn Reasoning Neural Networks". NAACL(2018) [paper]
- STD/HTD : "Learning to Ask Questions in Open-domain Conversational Systems with Typed Decoders". ACL(2018) [paper] [code]
- CSF : "Generating Informative Responses with Controlled Sentence Function". ACL(2018) [paper] [code]
- DAWnet : "Chat More: Deepening and Widening the Chatting Topic via A Deep Model". SIGIR(2018) [paper] [code]
- ZSDG : "Zero-Shot Dialog Generation with Cross-Domain Latent Actions". SIGDIAL(2018) [paper] [code]
- DUA : "Modeling Multi-turn Conversation with Deep Utterance Aggregation". COLING(2018) [paper] [code]
- Data-Aug : "Sequence-to-Sequence Data Augmentation for Dialogue Language Understanding". COLING(2018) [paper] [code]
- DC-MMI : "Generating More Interesting Responses in Neural Conversation Models with Distributional Constraints". EMNLP(2018) [paper] [code]
- cVAE-XGate/CGate : "Better Conversations by Modeling, Filtering, and Optimizing for Coherence and Diversity". EMNLP(2018) [paper] [code]
- Retrieval+multi-seq2seq : "An Ensemble of Retrieval-Based and Generation-Based Human-Computer Conversation Systems". IJCAI(2018) [paper]
- DAM : "Multi-Turn Response Selection for Chatbots with Deep Attention Matching Network". ACL(2018) [paper] [code]
- SMN : "Sequential Matching Network: A New Architecture for Multi-turn Response Selection in Retrieval-Based Chatbots". ACL(2017) [paper] [code]
- CVAE/KgCVAE : "Learning Discourse-level Diversity for Neural Dialog Models using Conditional Variational Autoencoders". ACL(2017) [paper] [code]
- TA-Seq2Seq : "Topic Aware Neural Response Generation". AAAI(2017) [paper] [code]
- MA : "Mechanism-Aware Neural Machine for Dialogue Response Generation". AAAI(2017) [paper]
- VHRED : "A Hierarchical Latent Variable Encoder-Decoder Model for Generating Dialogues". AAAI(2017) [paper] [code]
- HRED : "Building End-To-End Dialogue Systems Using Generative Hierarchical Neural Network Models". AAAI(2016) [paper] [code]
- RL-Dialogue : "Deep Reinforcement Learning for Dialogue Generation". EMNLP(2016) [paper]
- MMI : "A Diversity-Promoting Objective Function for Neural Conversation Models". NAACL(2016) [paper] [code]
? Zurück nach oben
Dialogue Evaluation
- DialogBench : "DialogBench: Evaluating LLMs as Human-like Dialogue Systems". NAACL(2024) [paper] [code]
- ChatEval : "ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate". arXiv(2023) [paper] [code]
- ACCENT : "ACCENT: An Automatic Event Commonsense Evaluation Metric for Open-Domain Dialogue Systems". ACL(2023) [paper] [code]
- LLMEval : "Understanding the Effectiveness of Very Large Language Models on Dialog Evaluation". IWSDS(2023) [paper]
- ChatEvalPlatform : "Don't Forget Your ABC's: Evaluating the State-of-the-Art in Chat-Oriented Dialogue Systems". arXiv(2022) [paper] [code]
- MDD-Eval : "MDD-Eval: Self-Training on Augmented Data for Multi-Domain Dialogue Evaluation". AAAI(2022) [paper] [code]
- Self-Eval : "SelF-Eval: Self-supervised Fine-grained Dialogue Evaluation". COLING(2022) [paper] [code]
- FineD-Eval : "FineD-Eval: Fine-grained Automatic Dialogue-Level Evaluation". EMNLP(2022) [paper] [code]
- FlowEval : "FlowEval: A Consensus-Based Dialogue Evaluation Framework Using Segment Act Flows". EMNLP(2022) [paper]
- IM2 : "IM^2: an Interpretable and Multi-category Integrated Metric Framework for Automatic Dialogue Evaluation". EMNLP(2022) [paper] [code]
- Q^2 : "$Q^{2}$: Evaluating Factual Consistency in Knowledge-Grounded Dialogues via Question Generation and Question Answering". EMNLP(2021) [paper] [code]
- QuantiDCE : "Towards Quantifiable Dialogue Coherence Evaluation". ACL(2021) [paper] [code]
- DynaEval : "DynaEval: Unifying Turn and Dialogue Level Evaluation". ACL(2021) [paper] [code]
- Review : "How to Evaluate Your Dialogue Models: A Review of Approaches". arXiv(2021) [paper]
- ConvLabEval : "Is Your Goal-Oriented Dialog Model Performing Really Well? Empirical Analysis of System-wise Evaluation". SIGDIAL(2020) [paper]
- FED : "Unsupervised Evaluation of Interactive Dialog with DialoGPT". SIGDIAL(2020) [paper] [code] [data]
- Spot-the-Bot : "Spot The Bot: A Robust and Efficient Framework for the Evaluation of Conversational Dialogue Systems". EMNLP(2020) [paper] [code]
- CMADE : "Beyond User Self-Reported Likert Scale Ratings: A Comparison Model for Automatic Dialog Evaluation". ACL(2020) [paper] [code]
- Coherence : "Dialogue Coherence Assessment Without Explicit Dialogue Act Labels". ACL(2020) [paper] [code]
- MAUDE : "Learning an Unreferenced Metric for Online Dialogue Evaluation". ACL(2020) [paper] [code]
- GRADE : "GRADE: Automatic Graph-Enhanced Coherence Metric for Evaluating Open-Domain Dialogue Systems". ACL(2020) [paper] [code]
- uBLEU : "uBLEU: Uncertainty-Aware Automatic Evaluation Method for Open-Domain Dialogue Systems". ACL(2020) [paper] [code]
- USR : "USR: An Unsupervised and Reference Free Evaluation Metric for Dialog Generation". ACL(2020) [paper] [code]
- ACUTE-EVAL : "ACUTE-EVAL: Improved Dialogue Evaluation with Optimized Questions and Multi-turn Comparisons". NIPS ConvAI Workshop(2019) [paper] [code]
- InteractiveEval : "Approximating Interactive Human Evaluation with Self-Play for Open-Domain Dialog Systems". NeurIPS(2019) [paper] [code]
- ChatEval : "ChatEval: A Tool for Chatbot Evaluation". NAACL(2019) [paper] [project]
- ADVMT : "One
Ruler for All Languages: Multi-Lingual Dialogue Evaluation with Adversarial Multi-Task Learning". IJCAI(2018) [paper]
? Zurück nach oben
Dialogue Misc.
- Signed-dialogue : "Generating Signed Language Instructions in Large-Scale Dialogue Systems". NAACL(2024) [paper] [data]
- Dialogue-KT : "Exploring Knowledge Tracing in Tutor-Student Dialogues". arXiv(2024) [paper] [code]
- MathDial : "MathDial: A Dialogue Tutoring Dataset with Rich Pedagogical Properties Grounded in Math Reasoning Problems". EMNLP-Findings(2023) [paper] [data]
- EduChat : "EduChat: A Large-Scale Language Model-based Chatbot System for Intelligent Education". arXiv(2023) [paper] [code]
- ACT : "Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training". arXiv(2024) [paper]
- ReviewMT : "Peer Review as A Multi-Turn and Long-Context Dialogue with Role-Based Interactions". arXiv(2024) [paper] [code]
- WildChat : "WildChat: 1M ChatGPT Interaction Logs in the Wild". ICLR(2024) [paper] [data]
- DialOp : "Decision-Oriented Dialogue for Human-AI Collaboration". arXiv(2023) [paper] [code]
- DialogStudio : "DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection for Conversational AI". arXiv(2023) [paper] [code]
- MPC : "Multi-Party Chat: Conversational Agents in Group Settings with Humans and Models". arXiv(2023) [paper] [code]
- SODA : "SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization". EMNLP(2023) [paper] [code]
- speaker-adaptation : "Speaking the Language of Your Listener: Audience-Aware Adaptation via Plug-and-Play Theory of Mind". ACL-Findings(2023) [paper] [code]
- SocialDial : "SocialDial: A Benchmark for Socially-Aware Dialogue Systems". SIGIR(2023) [paper] [data]
- BotsTalk : "BotsTalk: Machine-sourced Framework for Automatic Curation of Large-scale Multi-skill Dialogue Datasets". EMNLP(2022) [paper] [code]
- Dialogic : "Dialogic: Controllable Dialogue Simulation with In-Context Learning". EMNLP-Findings(2022) [paper] [code]
- ProsocialDialog : "ProsocialDialog: A Prosocial Backbone for Conversational Agents". EMNLP(2022) [paper] [code]
- MIC : "The Moral Integrity Corpus: A Benchmark for Ethical Dialogue Systems". ACL(2022) [paper] [code]
- MoralDial : "MoralDial: A Framework to Train and Evaluate Moral Dialogue Systems via Constructing Moral Discussions". arXiv(2022) [paper]
- DECODE : "I like fish, especially dolphins: Addressing Contradictions in Dialogue Modeling". ACL(2021) [paper] [code]
? Zurück nach oben
Natural Language Generation
Survey on NLG
- CTG : "A Survey of Controllable Text Generation using Transformer-based Pre-trained Language Models". arXiv(2022) [paper]
- RTG : "A Survey on Retrieval-Augmented Text Generation". arXiv(2022) [paper]
- Hallucination : "Survey of Hallucination in Natural Language Generation". arXiv(2022) [paper]
- Evaluation : "A Survey of Evaluation Metrics Used for NLG Systems". arXiv(2020) [paper]
? Zurück nach oben
NLG Theories and Techniques
- RED : "Decoder-Only or Encoder-Decoder? Interpreting Language Model as a Regularized Encoder-Decoder". arXiv(2023) [paper]
- LaMemo : "LaMemo: Language Modeling with Look-Ahead Memory". NAACL(2022) [paper] [code]
- PTG : "Learning to Transfer Prompts for Text Generation". NAACL(2022) [paper] [code]
- EISL : "Don't Take It Literally: An Edit-Invariant Sequence Loss for Text Generation". NAACL(2022) [paper] [code]
- CT-Loss : "A Simple Contrastive Learning Objective for Alleviating Neural Text Degeneration". arXiv(2022) [paper] [code]
- SimCTG : "A Contrastive Framework for Neural Text Generation". NeurIPS(2022) [paper] [code]
- CoNT : "CoNT: Contrastive Neural Text Generation". NeurIPS(2022) [paper] [code]
- Two-level-CL : "Keywords and Instances: A Hierarchical Contrastive Learning Framework Unifying Hybrid Granularities for Text Generation". ACL(2022) [paper]
- CLAPS : "Contrastive Learning with Adversarial Perturbations for Conditional Text Generation". ICLR(2021) [paper] [code]
- RetGen : "RetGen: A Joint framework for Retrieval and Grounded Text Generation Modeling". AAAI(2022) [paper] [code]
- RAG : "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks". NeurIPS(2020) [paper] [code]
- TextGAIL : "TextGAIL: Generative Adversarial Imitation Learning for Text Generation". AAAI(2021) [paper] [code]
- Latent-GLAT : " latent -GLAT: Glancing at Latent Variables for Parallel Text Generation". ACL(2022) [paper] [code]
- s2s-ft : "s2s-ft: Fine-Tuning Pretrained Transformer Encoders for Sequence-to-Sequence Learning". arXiv(2021) [paper] [code]
- EBM : "Exposure Bias versus Self-Recovery: Are Distortions Really Incremental for Autoregressive Text Generation?". EMNLP(2021) [paper]
- DiscoDVT : "DiscoDVT: Generating Long Text with Discourse-Aware Discrete Variational Transformer". EMNLP(2021) [paper] [code]
- DATG : "Data Augmentation for Text Generation Without Any Augmented Data". ACL(2021) [paper]
- JointGT : "JointGT: Graph-Text Joint Representation Learning for Text Generation from Knowledge Graphs". ACL-Findings(2021) [paper] [code]
- Embedding-Transfer : "Bridging Subword Gaps in Pretrain-Finetune Paradigm for Natural Language Generation". ACL(2021) [paper] [code]
- FastSeq : "EL-Attention: Memory Efficient Lossless Attention for Generation". ICML(2021) [paper] [code]
- BERTSeq2Seq : "Leveraging Pre-trained Checkpoints for Sequence Generation Tasks". TACL(2020) [paper] [code-tf] [code-py]
- ERNIE-GEN : "ERNIE-GEN: An Enhanced Multi-Flow Pre-training and Fine-tuning Framework for Natural Language Generation". IJCAI(2020) [paper] [code]
- DITTO : "Learning to Break the Loop: Analyzing and Mitigating Repetitions for Neural Text Generation". NeurIPS(2022) [paper] [code]
- Repetition-Problem : "A Theoretical Analysis of the Repetition Problem in Text Generation". AAAI(2021) [paper] [code]
- ENCONTER : "ENCONTER: Entity Constrained Progressive Sequence Generation via Insertion-based Transformer". EACL(2021) [paper] [code]
- POINTER : "POINTER: Constrained Progressive Text Generation via Insertion-based Generative Pre-training". EMNLP(2020) [paper] [code]
- Cascaded Generation : "Cascaded Text Generation with Markov Transformers". NeurIPS(2020) [paper] [code]
- SFOT : "Improving Text Generation with Student-Forcing Optimal Transport". EMNLP(2020) [paper]
- OT-Seq2Seq : "Improving Sequence-to-Sequence Learning via Optimal Transport". ICLR(2019) [paper] [code]
? Zurück nach oben
Diffusion Models for NLG
- RenderDiffusion : "RenderDiffusion: Text Generation as Image Generation". arXiv(2023) [paper]
- Masked-Diffusion-LM : "A Cheaper and Better Diffusion Language Model with Soft-Masked Noise". arXiv(2023) [paper] [code]
- discrete-diffusion : "A Reparameterized Discrete Diffusion Model for Text Generation". arXiv(2023) [paper] [code]
- Difformer : "Difformer: Empowering Diffusion Models on the Embedding Space for Text Generation". arXiv(2023) [paper]
- GENIE : "Text Generation with Diffusion Language Models: A Pre-training Approach with Continuous Paragraph Denoise". arXiv(2022) [paper] [code]
- SED : "Self-conditioned Embedding Diffusion for Text Generation". arXiv(2022) [paper]
- SSD-LM : "SSD-LM: Semi-autoregressive Simplex-based Diffusion Language Model for Text Generation and Modular Control". arXiv(2022) [paper] [code]
- LD4LG : "Latent Diffusion for Language Generation". arXiv(2022) [paper] [code]
- DiffusionBERT : "DiffusionBERT: Improving Generative Masked Language Models with Diffusion Models". arXiv(2022) [paper] [code]
- DiffusER : "DiffusER: Discrete Diffusion via Edit-based Reconstruction". arXiv(2022) [paper] [code]
- SeqDiffuSeq : "SeqDiffuSeq: Text Diffusion with Encoder-Decoder Transformers". arXiv(2022) [paper] [code]
- DiffuSeq : "DiffuSeq: Sequence to Sequence Text Generation with Diffusion Models". ICLR(2023) [paper] [code]
- Diffusion-LM : "Diffusion-LM Improves Controllable Text Generation". NeurIPS(2022) [paper] [code]
- D3PM : "Structured Denoising Diffusion Models in Discrete State-Spaces". NeurIPS(2021) [paper] [code]
? Zurück nach oben
Controllable Generation
- ConGenBench : "Controllable Text Generation in the Instruction-Tuning Era". arXiv(2024) [paper] [code]
- GeLaTo : "Tractable Control for Autoregressive Language Generation". arXiv(2023) [paper]
- Cognac : "Controllable Text Generation with Language Constraints". arXiv(2022) [paper] [code]
- CriticControl : "Critic-Guided Decoding for Controlled Text Generation". arXiv(2022) [paper]
- LatentOps : "Composable Text Controls in Latent Space with ODEs". arXiv(2022) [paper] [code]
- FAST : "FAST: Improving Controllability for Text Generation with Feedback Aware Self-Training". arXiv(2022) [paper]
- DisCup : "DisCup: Discriminator Cooperative Unlikelihood Prompt-tuning for Controllable Text Generation". EMNLP(2022) [paper] [code]
- MultiControl : "A Distributional Lens for Multi-Aspect Controllable Text Generation". EMNLP(2022) [paper] [code]
- NADO : "Controllable Text Generation with Neurally-Decomposed Oracle". NeurIPS(2022) [paper] [code]
- Mix-Match : "Mix and Match: Learning-free Controllable Text Generation using Energy Language Models". ACL(2022) [paper] [code]
- ControlPrefix : "Controllable Natural Language Generation with Contrastive Prefixes". ACL-Findings(2022) [paper]
- MUCOCO : "Controlled Text Generation as Continuous Optimization with Multiple Constraints". NeurIPS(2021) [paper] [code]
- DExperts : "DExperts: Decoding-Time Controlled Text Generation with Experts and Anti-Experts". ACL(2021) [paper] [code]
- FUDGE : "FUDGE: Controlled Text Generation With Future Discriminators". NAACL(2021) [paper] [code]
- GeDi : "GeDi: Generative Discriminator Guided Sequence Generation". EMNLP-Findings(2021) [paper] [code]
- GDC : "A Distributional Approach to Controlled Text Generation". ICLR(2021) [paper] [code]
- CoCon : "CoCon: A Self-Supervised Approach for Controlled Text Generation". ICLR(2021) [paper] [code]
- PPLM : "Plug and Play Language Models: A Simple Approach to Controlled Text Generation". ICLR(2020) [paper] [code]
- CTRL : "CTRL: A Conditional Transformer Language Model for Controllable Generation". arXiv(2019) [paper] [code]
? Zurück nach oben
Text Planning
- CoScript : "Distilling Script Knowledge from Large Language Models for Constrained Language Planning". ACL(2023) [paper] [code]
- RSTGen : "RSTGen: Imbuing Fine-Grained Interpretable Control into Long-FormText Generators". NAACL(2022) [paper]
- Time Control : "Language Modeling via Stochastic Processes". ICLR(2022) [paper] [code]
- PLANET : "PLANET: Dynamic Content Planning in Autoregressive Transformers for Long-form Text Generation". ACL(2022) [paper]
- EventPlan : "Event Transition Planning for Open-ended Text Generation". ACL-Findings(2022) [paper] [code]
- CETP : "Knowledge-based Review Generation by Coherence Enhanced Text Planning". SIGIR(2021) [paper]
- PlanGen : "Plan-then-Generate: Controlled Data-to-Text Generation via Planning". EMNLP-Findings(2021) [paper] [code]
- DYPLOC : "DYPLOC: Dynamic Planning of Content Using Mixed Language Models for Text Generation". ACL(2021) [paper] [code]
- Tree-PLAN : "Infobox-to-text Generation with Tree-like Planning based Attention Network". IJCAI(2020) [paper]
- ProphetNet : "ProphetNet: Predicting Future N-gram for Sequence-to-Sequence Pre-training". EMNLP-Findings(2020) [paper] [code]
- PAIR : "PAIR: Planning and Iterative Refinement in Pre-trained Transformers for Long Text Generation". EMNLP(2020) [paper] [code]
- SentPlan : "Sentence-Level Content Planning and Style Specification for Neural Text Generation". EMNLP(2019) [paper] [code]
- PHVM : "Long and Diverse Text Generation with Planning-based Hierarchical Variational Model". EMNLP(2019) [paper] [code]
- TwinNet : "Twin Networks: Matching the Future for Sequence Generation". ICLR(2018) [paper] [code]
- PAG : "Plan, Attend, Generate: Planning for Sequence-to-Sequence Models". NIPS(2017) [paper]
? Zurück nach oben
Decoding Algorithms
- Speculative Decoding : "Speculative Decoding: Exploiting Speculative Execution for Accelerating Seq2seq Generation". EMNLP-Findings(2023) [paper] [code]
- Medusa : "Medusa: Simple Framework for Accelerating LLM Generation with Multiple Decoding Heads". Github(2023) [Blog] [code]
- Lookahead Decoding : "Breaking the Sequential Dependency of LLM Inference Using Lookahead Decoding". LMSYS Org(2023) [Blog] [code]
- Speculative Sampling : "Accelerating Large Language Model Decoding with Speculative Sampling". arXiv(2023) [paper]
- Speculative Decoding : "Fast Inference from Transformers via Speculative Decoding". ICML(2023) [paper] [code]
- Parallel Decoding : "Accelerating Transformer Inference for Translation via Parallel Decoding". ACL(2023) [paper] [code]
- EAD : "The Stable Entropy Hypothesis and Entropy-Aware Decoding: An Analysis and Algorithm for Robust Natural Language Generation". arXiv(2023) [paper] [code]
- Contrastive Search : "Contrastive Search Is What You Need For Neural Text Generation". TMLR(2023) [paper] [code] [blog]
- Momentum Decoding : "Momentum Decoding: Open-ended Text Generation As Graph Exploration". arXiv(2022) [paper] [code]
- Crowd Sampling : "Follow the Wisdom of the Crowd: Effective Text Generation via Minimum Bayes Risk Decoding". arXiv(2022) [paper] [code]
- RankGen : "RankGen: Improving Text Generation with Large Ranking Models". EMNLP(2022) [paper] [code]
- Contrastive Decoding : "Contrastive Decoding: Open-ended Text Generation as Optimization". arXiv(2022) [paper] [code]
- COLD : "COLD Decoding: Energy-based Constrained Text Generation with Langevin Dynamics". NeurIPS(2022) [paper] [code]
- Lattice : "Massive-scale Decoding for Text Generation using Lattices". NAACL(2022) [paper] [code]
- KID : "Knowledge Infused Decoding". ICLR(2022) [paper] [code]
- NeuroLogic A*esque : "NeuroLogic A *esque Decoding: Constrained Text Generation with Lookahead Heuristics". NAACL(2022) [paper] [code]
- NeuroLogic : "NeuroLogic Decoding: (Un)supervised Neural Text Generation with Predicate Logic Constraints". NAACL(2021) [paper] [code]
- DeLorean : "Back to the Future: Unsupervised Backprop-based Decoding for Counterfactual and Abductive Commonsense Reasoning". EMNLP(2020) [paper] [code]
- Top-p (Nucleus) Sampling : "The Curious Case of Neural Text Degeneration". ICLR(2020) [paper] [code]
- BP Decoding : "Blockwise Parallel Decoding for Deep Autoregressive Models". NIPS(2018) [paper]
- Disjunctive Constraints : "Guided Generation of Cause and Effect". IJCAI(2020) [paper] [code-huggingface]
- CGMH : "CGMH: Constrained Sentence Generation by Metropolis-Hastings Sampling". AAAI(2019) [paper] [code]
- DBS : "Directed Beam Search: Plug-and-Play Lexically Constrained Language Generation". arXiv(2020) [paper] [code]
- DBA : "Fast Lexically Constrained Decoding with Dynamic Beam Allocation for Neural Machine Translation". NAACL(2018) [paper] [code-official] [code-fairseq]
- GBS : "Lexically Constrained Decoding for Sequence Generation Using Grid Beam Search". ACL(2017) [paper] [code]
? Zurück nach oben
NLG Evaluation
- Survey : "Leveraging Large Language Models for NLG Evaluation: A Survey". arXiv(2024) [paper]
- BBScore : "BBScore: A Brownian Bridge Based Metric for Assessing Text Coherence". AAAI(2024) [paper]
- GPTEval : "GPTEval: NLG Evaluation using GPT-4 with Better Human Alignment". arXiv(2023) [paper]
- GPTScore : "GPTScore: Evaluate as You Desire". arXiv(2023) [paper] [code]
- RoMe : "RoMe: A Robust Metric for Evaluating Natural Language Generation". ACL(2022) [paper] [code]
- EAD : "Rethinking and Refining the Distinct Metric". ACL(2022) [paper] [code]
- MID : "Mutual Information Divergence: A Unified Metric for Multimodal Generative Models". NeurIPS(2022) [paper]
- DiscoScore : "DiscoScore: Evaluating Text Generation with BERT and Discourse Coherence". arXiv(2022) [paper] [code]
- CTC-Score : "Compression, Transduction, and Creation: A Unified Framework for Evaluating Natural Language Generation". EMNLP(2021) [paper] [code]
- BLEURT : "BLEURT: Learning Robust Metrics for Text Generation". ACL(2020) [paper] [code]
? Zurück nach oben