종이 읽기 코바이
대화 AI의 종이 읽기 목록, 주로 대화 시스템 과 자연 언어 생성을 포함합니다. 이 저장소가 지속적으로 업데이트되고 있습니까? ...
- NLP의 딥 러닝
- 대화 시스템
- 대화에 대한 설문 조사
- 대화 LLM
- 멀티 모달 대화
- 위치되고 구체화 된 대화
- 시각적으로 근거한 대화
- 능동적 인 대화
- 기타. 능동적 인 대화의
- 목표 지향 대화
- 비 저수화 대화 (설득 및 협상)
- 개인화 된 대화
- 캐릭터 기반 대화
- 성격 인식 대화
- 페르소나 기반 대화
- 정서적 대화
- 추천 대화 및 CR
- 지식 지상 대화
- 작업 지향 대화
- 열린 도메인 대화
- 대화 평가
- 대화 기타.
- 자연어 생성
- NLG에 대한 조사
- NLG 이론 및 기술
- NLG에 대한 확산 모델
- 제어 가능한 세대
- 텍스트 계획
- 디코딩 알고리즘
- NLG 평가
NLP의 딥 러닝
- INLP : "대화식 자연 언어 처리". Arxiv (2023) [종이]
- 데이터 확대 : "NLP에 대한 데이터 확대 접근법 설문 조사". ACL 찾기 (2021) [종이]
- 프롬프트 : "사전 훈련, 프롬프트 및 예측 : 자연 언어 처리에서 방법에 대한 체계적인 조사". Arxiv (2021) [종이]
- NLP 세계 범위 : "언어를 경험하십시오". Emnlp (2020) [종이]
- Transformer-XL : "Transformer-XL : 고정 길이의 컨텍스트를 넘어 세심한 언어 모델". ACL (2019) [논문] [코드]
- 변압기 : "주의가 필요한 전부입니다". Neurips (2017) [논문] [Code-Official] [Code-TF] [Code-Py]
- VAE : "변형 자동 인코더 소개". Arxiv (2019) [종이]
- 주의 설문 조사 : "NLP 문제의주의 메커니즘에 대한 입문 조사". Arxiv (2018) [종이]
- 부가 적주의 : "조정하고 번역하는 법을 배우는 신경 기계 번역". ICLR (2015) [종이]
- 곱셈주의 : "주의 기반 신경 기계 번역에 대한 효과적인 접근". Emnlp (2015) [종이]
- 메모리 네트 : "엔드 투 엔드 메모리 네트워크". Neurips (2015) [종이]
- 복사 메커니즘 (PGN) : "포인트로 이동 : 포인터 제너레이터 네트워크를 사용한 요약". ACL (2017) [논문] [코드]
- 카피 메커니즘 : "순서 대 시퀀스 학습에 복사 메커니즘을 통합". ACL (2016) [종이]
- Elmo : "깊은 맥락화 된 단어 표현". Naacl (2018) [논문] [코드]
- 장갑 : "장갑 : 단어 표현을위한 글로벌 벡터". EMNLP (2014) [논문] [코드]
- Word2Vec 자습서 : "Word2Vec 매개 변수 학습이 설명되었습니다". Arxiv (2016) [종이]
- 멀티 태스킹 학습 : "심층 신경망에서의 멀티 태스킹 학습에 대한 개요". Arxiv (2017) [종이]
- 그라디언트 하강 : "그라디언트 하강 최적화 알고리즘의 개요". Arxiv (2016) [종이]
? 위로 돌아갑니다
대화 시스템
대화에 대한 설문 조사
- 데이터 생성 : "최근 대화 데이터 생성의 발전에 대한 설문 조사". Arxiv (2024) [종이]
- 사전 대화 : "사전 대화 시스템에 대한 설문 조사 : 문제, 방법 및 전망". IJCAI (2023) [종이]
- 책임있는 대화 : "안전하고 책임감 있고 도덕적 대화 시스템에 대한 최근 발전 : 설문 조사". Arxiv (2023) [종이]
- 협상 대화 : "협상하자! 협상 대화 시스템의 조사". Arxiv (2022) [종이]
- DL 기반 대화 : "최근 딥 러닝 기반 대화 시스템의 발전 : 체계적인 조사". Arxiv (2021) [종이]
- 오픈 도메인 대화 : "지능형 오픈 도메인 대화 시스템 구축의 도전". Tois (2020) [종이]
- 대화 시스템 : "대화 시스템에 대한 설문 조사 : 최근의 발전 및 새로운 국경". SIGKDD 탐색 (2017) [논문]
- Dialogue Corpora : "데이터 중심 대화 시스템 구축을위한 사용 가능한 Corpora 설문 조사". Arxiv (2017) [논문] [데이터]
? 위로 돌아갑니다
대화 LLM
- Parrot : "Parrot : 질문을하는 법을 배우면서 멀티 회전 채팅 모델 향상". Arxiv (2023) [종이]
- Memochat : "Memochat : 일관된 장거리 오픈 도메인 대화를 위해 메모를 사용하도록 LLM을 조정합니다." Arxiv (2023) [종이]
- Llama 2-Chat : "Llama 2 : 오픈 파운데이션 및 미세 조정 된 채팅 모델". 메타 (2023) [논문] [코드]
- chatglm3 : "Chatglm3 시리즈 : 이중 언어 채팅 LLMS 열기". Tsinghua (2023) [코드]
- ChatGlm2-6b : "ChatGlm2-6b : 열린 이중 언어 채팅 LLM". Tsinghua (2023) [코드]
- MPC : "긴 오픈 도메인 대화를 위해 LLM을 챗봇 모듈로 프롬프트했습니다." ACL 찾기 (2023) [논문] [코드]
- MemoryBank-SiliconFriend : "MemoryBank : 장기 메모리로 대형 언어 모델 향상". Arxiv (2023) [논문] [코드]
- Ultrachat : "고품질 수업 대화를 확장하여 채팅 언어 모델 향상". Arxiv (2023) [논문] [데이터]
- Chatalpaca : "Chatalpaca : Alpaca 지침을 기반으로 한 다중 회전 대화 코퍼스". Github (2023) [데이터]
- 피닉스 : "피닉스 : 언어를 가로 질러 채팅을 민주화". Arxiv (2023) [논문] [코드]
- Dolly : "Free Dolly : 세계 최초의 진정으로 개방 된 명령 조정 LLM 소개". Databricks (2023) [코드]
- Baize : "Baize : 자체 chat 데이터에 대한 매개 변수 효율적인 튜닝이있는 오픈 소스 채팅 모델". Arxiv (2023) [논문] [코드]
- Vicuna : "Vicuna : 90% Chatgpt 품질로 GPT-4에 감동을주는 오픈 소스 챗봇". lmsys org (2023) [블로그] [코드]
- 코알라 : "코알라 : 학업 연구를위한 대화 모델". UC Berkeley (2023) [블로그] [코드]
- Belle : "Belle : 모든 사람의 대형 언어 모델 엔진". Lianjiatech (2023) [코드]
- Alpaca : "알파카 : 강력하고 복제 가능한 명령을 따르는 모델". 스탠포드 (2023) [블로그] [코드] [알파카-로라]
- ChatGLM-6B : "열린 이중 언어 대화 언어 모델". Tsinghua (2023) [코드]
- 오픈 보조 : "오픈 어시스턴트 : 모든 사람을위한 대화식 AI". Github (2023) [프로젝트] [코드]
- chatgpt : "Chatgpt : 대화를위한 언어 모델 최적화". Openai (2022) [블로그]
- 참새 : "대상 인간의 판단을 통한 대화 에이전트의 정렬 개선". Arxiv (2022) [논문] [데이터]
- Blenderbot3 : "Blenderbot 3 : 지속적으로 책임감있게 참여하는 법을 배우는 배치 된 대화 상담원". Arxiv (2022) [종이]
- Lamda : "Lamda : 대화 상자 응용 프로그램을위한 언어 모델". Arxiv (2022) [종이]
- Godel : "Godel : 목표 지향적 인 대화에 대한 대규모 사전 훈련". Arxiv (2022) [논문] [코드]
- Anthropic Assistant-V2 : "인간의 피드백으로부터 강화 학습을 통해 도움이되고 무해한 조수를 훈련". Arxiv (2022) [종이]
- 인류 조교 : "정렬 실험실로서 일반 언어 보조". Arxiv (2021) [종이]
? 위로 돌아갑니다
멀티 모달 대화
위치되고 구체화 된 대화
- SLL : "제 2 언어 학습을위한 대형 언어 모델 기반 상황 대화". Arxiv (2024) [종이]
- EMB-PLAN : "합성 구체화 된 대화로 증가 된 다중 모드 구체화 계획 예측". EMNLP (2023) [종이]
- WTAG : "기초 모델이 케이크를 만들기 위해 단계별로 감시하고 말하고 안내 할 수 있습니까?" Emnlp-findings (2023) [논문] [코드]
- SIMMC-VR : "SIMMC-VR : 위치가 있고 몰입 형 VR 스트림이있는 작업 지향적 멀티 모드 대화 데이터 세트". ACL (2023) [종이]
- 물론 : "주관적 선호도를 가진 멀티 모달 추천 대화 : 새로운 도전 및 벤치 마크". ACL (2023) [논문] [데이터]
- 설탕 : "적극적으로 적극적 인 응답 선택을위한 텍스트 데이터 세트". ACL (2023) [논문] [데이터]
- MindDial : "MindDial : 신경 대화 생성에 대한 이론 모델링을 사용한 신념 역학 추적". Arxiv (2023) [종이]
- Holoassist : "Holoassist : 실제 세계의 대화식 AI 보조원을위한 Egocentric Human Interaction 데이터 세트". ICCV (2023) [논문] [데이터]
- Collab : "위치한 대화에서 마인드 모델링 이론을 통한 협업 계획 획득을 향한". IJCAI (2023) [논문] [코드]
- Alexa Arena : "Alexa Arena : 구체화 된 AI를위한 사용자 중심의 대화식 플랫폼". Arxiv (2023) [논문] [코드]
- Seagull : "Seagull : 위치한 대화를 통한 지시를위한 구체화 된 대리인". Alexa Prize Simbot Challenge (2023) [논문]
- Sitcom-Detr : "당신은 어느 것을 말하고 있습니까? 다중 모드 객체 식별에 따라 대화식 대화에서". EACL-SRW (2023) [논문] [코드]
- MLR : "단계별 다중 모달 논리 추론을 가진 대화 에이전트 개선". DSTC11 (2023) [종이]
- Simplemtod : "Simplemtod : 상징적 장면 표현을 사용한 다중 모드 작업 지향 대화를위한 간단한 언어 모델". Arxiv (2023) [종이]
- 스프링 : "스프링 : 위치한 대화 에이전트는 증분 레이아웃 그래프에서 멀티 모달 질문으로 전망합니다". AAAI (2023) [논문] [코드]
- Dorothie : "Dorothie : 대화식 자율 주행 요원의 예기치 않은 상황을 처리하기위한 음성 대화". Emnlp-findings (2022) [논문] [코드]
- 조명 교과 : "절차 환경 생성을 통한 대화 상담 학습". ACL (2022) [종이]
- Danli : "Danli : 자연어 지침을 따르는 심의 대리인". EMNLP (2022) [논문] [코드]
- PRS : "실용적인 의사 소통에 대한 불일치를 중재하는 법을 배우는 것". ACL (2022) [논문] [코드]
- 조인트 모델 : "대화 에이전트에 대한 다중 모달 컨텍스트를 포함하는 법을 배우는 것". NaaCl-findings (2022) [논문] [코드]
- Teach_film : "교사를 복사하지 마십시오 : 구체화 된 대화에서 데이터와 모델 과제". EMNLP (2022) [논문] [코드]
- 가르치기 : "가르치기 : 채팅하는 작업 중심의 구체화 된 에이전트". AAAI (2022) [논문] [데이터]
- 마인드 크래프트 : "마인드 크래프트 : 협업 작업에서 위치한 대화에 대한 마인드 모델링 이론". EMNLP (2021) [논문] [코드]
- 멀티 모달-모델 : "SIMMC 2.0에 대한 사전 조정 된 단일 모달 모델을 사용한 다중 모드 상호 작용". DSTC10 (2022) [논문] [코드]
- SIMMC 2.0 : "SIMMC 2.0 : 몰입 형 다중 모드 대화를위한 작업 지향 대화 상자 데이터 세트"EMNLP (2021) [논문] [코드]
- MM-DST : "위치한 멀티 도메인 엔드 투 엔드 대화 시스템에 대한 멀티 태스킹 학습". Arxiv (2021) [종이]
- SIMMC : "위치 및 대화식 멀티 모드 대화". Coling (2020) [논문] [코드]
- Minecraft-Bap : "Minecraft 대화에서 지시를 실행하는 법을 배우는 것". ACL (2020) [논문] [코드]
- CREEALBAR : "공동 협력 상호 작용에 대한 지침 실행". EMNLP (2019) [논문] [코드]
- Minecraft Dialogue : "Minecraft의 협업 대화". ACL (2019) [논문] [코드]
- CLG : "인간 - 로봇 대화에 위치한 공동 언어 근거". AI 잡지 (2016) [종이]
- Shrd : "Blocks World로 돌아 가기 : 위치한 인간-로봇 대화를 통해 새로운 행동을 배우십시오". Sigdial (2014) [종이]
시각적으로 근거한 대화
- Tiger : "Tiger : 멀티 모달 대화 응답 생성을위한 통합 생성 모델 프레임 워크". 콜링 (2024). [종이] [코드]
- DialogCC : "DialogCC : 고품질 다중 모달 대화 데이터 세트를 생성하기위한 자동화 된 파이프 라인". NAACL (2024) [종이] [데이터]
- Vlaw-MDM : "멀티 모달 대화 모델에서 비전 언어 예열 작업을위한 프레임 워크". EMNLP (2023) [논문] [코드]
- Zrigf : "Zrigf : 제로 소스 이미지 지상 대화 생성을위한 혁신적인 멀티 모달 프레임 워크". ACM MM (2023) [논문] [코드]
- vdialogue : "Vdialogue : 시각적으로 근거가있는 대화를위한 통합 평가 벤치 마크". Arxiv (2023) [종이]
- TextBind : "TextBind : 다중 회전 인터리브 다중 모드 명령어에서 야생에서 팔로우하는 것". Arxiv (2023) [논문] [데이터]
- VSTAR : "VSTAR : 장면 및 주제 전환에 대한 의미 론적 이해를위한 비디오 기반 대화 데이터 세트". ACL (2023) [논문] [데이터]
- comset : "멀티 모달 페르소나 기반 만화 대화의 생성". ACL (2023) [논문] [코드]
- MPCHAT : "MPCHAT : 멀티 모달 페르소나 지상 대화를 향해". ACL (2023) [논문] [코드]
- 페이스 : "페이스 : 진보적이고 구성 전문가와의 통일 된 다중 모달 대화 사전 훈련". ACL (2023) [논문] [코드]
- MMDIALOG : "MMDIALOG : 멀티 모달 오픈 도메인 대화를 향한 대규모 다중 회전 대화 데이터 세트". ACL (2023) [논문] [데이터]
- MDS-S2 : "이중 의미 론적 지식을 구성하여 멀티 모달 대화 시스템". 시기르 (2023) [종이]
- Tiktalk : "Tiktalk : 실제 chitchat을위한 멀티 모달 대화 데이터 세트". Arxiv (2023) [논문] [코드]
- 샴페인 : "샴페인 : 대규모 웹 비디오에서 실제 대화를 배우십시오". Arxiv (2023) [논문] [코드]
- MMCHAT : "MMCHAT : 소셜 미디어의 멀티 모달 채팅 데이터 세트". LREC (2022) [논문] [코드]
- CRVD : "비디오 기반 대화 생성을위한 다중 모달 의미 그래프에 대한 공동 추론". Emnlp-findings (2022) [종이]
- M3ED : "M3ed : 멀티 모달 멀티-스페인 멀티 라벨 감정적 대화 데이터베이스". ACL (2022) [논문] [데이터]
- MDRG : "멀티 모달 대화 응답 생성". ACL (2022) [종이]
- UnitRanser : "UnitRanser : 멀티 모달 작업 지향 대화 시스템을위한 통합 변압기 시맨틱 표현 프레임 워크". ACL (2022) [종이]
- Photochat : "Photochat : 공동 텍스트 모델링을위한 사진 공유 동작이있는 인간 인간 대화 데이터 세트". ACL (2021) [논문] [데이터]
- 다중 모달 대화 : "텍스트를 의미 적으로 관련된 이미지로 바꾸어 다중 모달 대화 데이터 세트 구성". ACL (2021) [논문] [코드]
- OpenVidial 2.0 : "OpenVidial 2.0 : 시각적 컨텍스트가있는 대규모 오픈 도메인 대화 생성 데이터 세트". Arxiv (2021) [논문] [데이터]
- 보물 : "멀티 모달 대화 시스템 : 관계형 그래프 기반 컨텍스트 인식 질문 이해". ACM MM (2021) [논문] [코드]
- MMCONV : "MMCONV : 여러 도메인에서 멀티 모달 대화 검색을위한 환경". Sigir (2021) [종이] [데이터]
- 이미지 채팅 : "이미지 채팅 : 기반 대화 참여". ACL (2020) [종이] [데이터]
- MTN : "엔드 투 엔드 비디오 근거 대화 시스템을위한 멀티 모달 변압기 네트워크". ACL (2019) [논문] [코드]
- MELD : "MELD : 대화에서 감정 인식을위한 멀티 모달 멀티 파티 데이터 세트". ACL (2019) [종이] [데이터]
- Clevr-Dialog : "Clevr-Dialog : 시각적 대화에서 다중 라운드 추론을위한 진단 데이터 세트". Naacl (2019) [종이] [데이터]
- Visdial-RL : "다양한 질문에 대답하여 생성 시각적 대화 개선". EMNLP (2019) [논문] [코드]
- 마술 : "멀티 모달 대화 시스템 : 적응 형 디코더를 통한 응답 생성". ACM MM (2019) [논문] [코드]
- KMD : "지식 인식 다중 모드 대화 시스템". ACM MM (2018) [종이]
- MMD : "대규모 멀티 모달 도메인 인식 대화 시스템을 구축하기 위해". AAAI (2018) [논문] [데이터]
- 워크에 대해 이야기하십시오 . "걷기 : 그라운드 대화를 통해 뉴욕시를 탐색하십시오". Arxiv (2018) [논문] [코드]
- IGC : "이미지 지정 대화 : 자연스러운 질문 및 응답 생성을위한 멀티 모달 컨텍스트". IJCNLP (2017) [논문] [데이터]
- Visdial : "시각적 대화". CVPR (2017) [논문] [데이터]
? 위로 돌아갑니다
능동적 인 대화
기타. 능동적 인 대화의
- DPDP : "인간과 같은 계획 : 대화 계획을위한 이중 프로세스 프레임 워크". ACL (2024) [논문] [코드]
- PCA : "인간 중심의 사전 대화 에이전트를 향해". 시기르 (2024) [종이]
- Procot : "사전 대응 대화에 대한 대형 언어 모델을 제기하고 평가하는 것 : 설명, 대상 유도 및 비 청구". Emnlp-findings (2023) [논문] [코드]
- 튜토리얼 : "대화 AI에 대한 목표 인식 : 사전 예방성, 비 체외 및 그 너머". ACL (2023) [종이]
목표 지향 대화
- PAI : "온라인 교육에서 목표 지향적 지능형 개인지도 시스템을 향해". Arxiv (2023) [종이]
- TOPDIAL : "개인화를 가진 대상 지향적 사전 대화 시스템 : 문제 공식화 및 데이터 세트 큐 레이션". EMNLP (2023) [논문] [코드]
- RTCP : "강화 된 목표 중심 대화 프로모션". EMNLP (2023) [논문] [코드]
- MTGP : "MTGP : 유연한 회전을 가진 생성 글로벌 경로에 의해 안내 된 다중 회전 대상 지향 대화". ACL 찾기 (2023) [논문] [코드]
- 색상 : "목표 지향적 사전 대화를위한 Brownian Bridge 확률 론적 프로세스를 통한 대화 계획". ACL 찾기 (2023) [논문] [코드]
- TOPKG : "TOPKG : 지식 그래프에 대한 글로벌 계획을 통한 대상 지향 대화". Coling (2022) [논문] [코드]
- TGCP : "목표 유도 오픈 도메인 대화 계획". Coling (2022) [논문] [코드]
- FOP : "대화 생성을위한 장기 통제 : 방법 및 평가". NaaCl (2022) [논문] [코드]
- Coda : "공립 및 데이터 확대를 사용한 대상 유도 대화 응답 생성". NaaCl-findings (2022) [논문] [코드]
- OTTER : "OTTERS : Open-Domain 대화의 한 회전 주제 전환". ACL (2021) [논문] [데이터]
- CG-NAR : "명확하게 생각하고, 빠르게 이야기 : 개방형 도메인 대화 시스템에 대한 개념 유도 비 유사성 세대". EMNLP (2021) [논문] [코드]
- DUCONV : "명백한 대화 목표와의 인간 상자 대화". ACL (2019) [논문] [코드]
- CKC : "키워드 유도 신경 대화 모델". AAAI (2021) [논문] [코드]
- Knowhrl : "지식 그래프가 열린 도메인 대화 생성을위한 목표 계획". AAAI (2020) [종이]
- DKRN : "목표 유도 오픈 도메인 대화를위한 동적 지식 라우팅 네트워크". AAAI (2020) [논문] [코드]
- TGCONV : "목표 유도 오픈 도메인 대화". ACL (2019) [논문] [코드]
비 저수화 대화 (설득 및 협상)
- 여행 : "강도는 차이가 있습니다! 맞춤형 전략 계획을 통한 효과적인 비 수사 대화에 대한 것" ". Arxiv (2024) [종이]
- INA : "INA : 보상 기반 대화 시스템으로 협상 전략을 향상시키기위한 통합 접근법". EMNLP (2023) [논문] [데이터]
- I-Pro : "비 협력 사용자와의 상호 작용 : 사전 대화 정책을위한 새로운 패러다임". 시기르 (2022) [종이]
- PAAD : "진보 인식 자율 대화 에이전트를 향해". NaaCl (2022) [논문] [코드]
- persrfi : "개선 및 모방 : 강화 학습 및 인간 데모를 통한 설득 대화에서 반복과 불일치를 줄입니다". Emnlp-findings (2021) [논문] [코드]
- Resper : "Resper : 설득력있는 대화에서 저항 전략을 계산 적으로 모델링". EACL (2021) [논문] [코드]
- ARDM : "대규모 미리 훈련 된 언어 모델을 가진 반복 대화 모델을 교대로 발전시킵니다". EACL (2021) [논문] [코드]
- Dialograph : "Dialograph : 해석 가능한 전략 그래프 네트워크를 협상 대화에 통합". ICLR (2021) [논문] [코드]
- 협상 : "성격 모델링과의 협상을위한 대화 시스템 개선". ACL (2021) [논문] [코드]
- FEHED : "명시 적 의미 및 전략적 대화 이력을 갖춘 비 심사 대화 시스템을 확대". ICLR (2020) [논문] [코드]
- CTX-PSA : "개방형 대화 시스템에 대해 별도로 계획하고 실현하는 법을 배우는 것". Emnlp-findings (2020) [논문] [코드]
- 협상 코치 : "효과적인 협상을위한 역동적 인 전략 코치". Sigdial (2019) [논문] [코드]
- 설득력 : "선을위한 설득 : 사회적 선을위한 개인화 된 설득력있는 대화 시스템을 향한". ACL (2019) [종이] [데이터]
- Craigslistbargain : "협상 대화에서 전략과 세대의 분리". EMNLP (2018) [논문] [데이터]
? 위로 돌아갑니다
개인화 된 대화
캐릭터 기반 대화
- LLM-Werewolf : "커뮤니케이션 게임을위한 대형 언어 모델 탐색 : 늑대 인간에 대한 경험적 연구". Arxiv (2023) [종이]
- Chatharuhi : "Chatharuhi : 대형 언어 모델을 통해 실제로 애니메이션 캐릭터를 부활". ARXIV (2023) [보고서] [코드]
- DPCD : "안녕하세요 Sheldon! TV 쇼에서 깊은 개인화 된 캐릭터 만들기". Arxiv (2023) [논문] [데이터]
- Cornell-rich : "풍부한 메타 데이터 주석을 사용한 화면 문자의 개인화 된 언어 모델링". Arxiv (2023) [논문] [데이터]
- Knudge : "비 플레이어 캐릭터 대화의 존재 론적 충실한 세대". 아 성병 (2022) [종이]
- HPD : "대형 언어 모델은 해리포터를 만나고 대화 에이전트를 캐릭터와 정렬하기위한 이중 언어 데이터 세트". Arxiv (2022) [논문] [데이터]
- 다이얼 스토리 : "이야기에서 캐릭터들 사이의 대화를 이해하고 생성하기위한 벤치 마크". Arxiv (2022) [종이]
- CARECALL : "대규모 언어 모델을 활용하는 Open-Domain 대화 시스템을 지정된 역할 구축". NAACL (2022) [논문] [데이터]
- PDP : "좋아하는 캐릭터 만나기 : Open-Domain Chatbot가 소설을 몇 가지 말로 흉내냅니다." NaaCl (2022) [논문] [코드]
- RPA : "나 또는 당신? 최신 대화 모델은 정체성을 유지할 수 없습니다". Naacl-Findings (2022) [종이]
- 캐릭터 chat : "캐릭터 캣 : 대화와 챗봇으로 진보적 인 표현을 통해 가상의 인물의 창조를 지원합니다". ACM C & C (2021) [종이]
- Aloha : "Aloha : 대화 에이전트를위한 인간 속성에 대한 인공 학습". AAAI (2020) [논문] [코드]
- 빛 : "판타지 텍스트 어드벤처 게임에서 말하고 행동하는 법을 배우십시오". EMNLP (2019) [논문] [데이터]
성격 인식 대화
- UBPL : "감독되지 않은 개인화 된 어휘를 통해 대형 언어 모델의 성격 특성을 맞춤화". Arxiv (2023) [종이]
- 캐릭터 chat : "캐릭터 chat : 개인화 된 사회적 지원을 가진 대화식 AI에 대한 학습". Arxiv (2023) [논문] [코드]
- Chatgpt-MBTI : "Chatgpt가 인간의 성격을 평가할 수 있습니까? 일반적인 평가 프레임 워크". Arxiv (2023) [논문] [코드]
- 프롬프트 개성 : "제로 샷 프롬프트 기반 학습과 대화에서 성격 스타일을 제어". IWSDS (2023) [종이]
- CPED : "CPED : 대화식 AI를위한 대규모 중국 개인 및 정서적 대화 데이터 세트". Arxiv (2022) [논문] [데이터]
- PELD : "성격에 영향을받는 감정 전환을 통해 응답에 대한 감정을 자동으로 선택하십시오". ACL 찾기 (2021) [논문] [데이터]
- Friendspersona : "세심한 네트워크 및 상황에 맞는 임베딩을 사용한 독백 및 다자 대화에 대한 자동 텍스트 기반 성격 인식". AAAI-Student Abstract (2020) [논문] [데이터]
- APR : "다자 대화에서 오버랩 역학을 사용하여 성격 특성을 식별". Interspeech (2019) [종이]
- PersonalDilaog : "다양한 특성을 가진 개인화 된 대화 생성". Arxiv (2019) [논문] [데이터]
- Personagenlg : "신경 자연 언어 생성기와의 성격 기반 스타일 변화를 통제". Sigdial (2018) [논문] [데이터]
페르소나 기반 대화
- ComperDial : "ComperDial : Commonsense Persona-Ground Dialogue DataSet 및 Benchmark". Arxiv (2024) [종이]
- IDL : ""대화에서 우리가 배우는 대화 ": 현지 학습을 통해 사전 정의 된 프로파일없이 개인화 된 대화를 향해". Arxiv (2024) [종이]
- Dialogicl : "좋은 프롬프트를 만들거나 모범적 인 대화를 제공 하는가? 페르소나 기반 대화 생성을위한 텍스트 내 학습에 대한 연구". Arxiv (2024) [종이]
- varmi : "오프라인 강화 학습을 가진 페르소나 일관된 대화 에이전트 구축". EMNLP (2023) [논문] [코드]
- Opela : "군중이 페르소나를 만날 때 : 대규모 오픈 도메인 페르소나 대화 코퍼스를 만듭니다." Arxiv (2023) [논문] [데이터]
- Orig : "질서에 민감한 표현 정규화를 통해 강력한 개인화 된 대화 생성을 향해". ACL 찾기 (2023) [논문] [코드]
- CLV : "대조적 인 잠재 변수로 개인화 된 대화 생성 향상 : 희소하고 밀도가 높은 페르소나를 결합합니다." ACL (2023) [논문] [코드]
- SIMOAP : "SIMOAP : 과도한 샘플링 및 사후 사후의 페르소나 기반 대화 생성의 일관성과 일관성 향상". ACL (2023) [논문] [코드]
- LMEDR : "페르소나 일관성 대화에 대한 자극과 담론 관계를 암기하는 법을 배우는 것". AAAI (2023) [논문] [코드]
- 검색-예비 : "페르소나 확장에 의한 대화의 성격 일관성 향상". CIKM (2022) [논문] [코드]
- 암시 적-개인 : "암시 적 사용자 페르소나 탐지를 가진 개인화 된 대화 생성기". Coling (2022) [종이]
- CARECALLMEMORY : "장기 대화에서 메모리 관리를 계속 업데이트하십시오". Emnlp-findings (2022) [논문] [데이터]
- Personadefense : "당신은 내가 가장 좋아하는 색을 모른다 : 대화 표현이 화자의 개인 인물을 드러내는 것을 방지한다". NaaCl (2022) [논문] [코드]
- 프롬프트 조정 : "프롬프트 조정으로 개인화 된 대화 시스템 구축". NAACL-SRW (2022) [종이]
- DULEMON : "오랜 시간이 보이지 않습니다! 장기 페르소나 기억과의 공개 도메인 대화". ACL 찾기 (2022) [논문] [데이터]
- 정보 : "당신은 내가 필요로하는 것을 진정으로 이해합니다 : 지적 및 친근한 대화 에이전트 지식과 페르소나를 근거로합니다." Emnlp-findings (2022) [논문] [코드]
- 포커스 : "맞춤형 대화를 요청 : 맞춤형 대화를 거쳐 페르소나 및 지식". AAAI (2022) [논문] [코드]
- MSP : "더 적은 점 : 개인화 된 대화 생성을위한 대화 역사를 개선하는 법을 배우는 것". Naacl (2022) [종이]
- GME : "최소한의 편집을 통한 전송 가능한 페르소나 지상 대화". EMNLP (2021) [논문] [코드]
- Bob : "Bob : 제한된 개인화 된 데이터에서 페르소나 기반 대화 모델을 훈련하기위한 Bert Over Bert". ACL (2021) [논문] [코드]
- PABST : "배경 이야기가있는 페르소나 지상 대화의 감독되지 않은 풍부한 풍요". ACL (2021) [논문] [코드]
- DHAP : "1 인당 한 챗봇 : 암시 적 사용자 프로파일을 기반으로 개인화 된 챗봇 작성". 시기르 (2021) [종이]
- PCHATBOT : "PCHATBOT : 개인화 된 챗봇을위한 대규모 데이터 세트". Sigir (2021) [종이] [데이터]
- Compac : "하이킹처럼? 당신은 아마도 자연을 즐기고있을 것입니다. EMNLP (2020) [논문] [코드]
- 실용적 일관성 : "나처럼 들릴 것인가? 실용적인 자의식을 통한 대화의 페르소나 일관성 향상". EMNLP (2020) [논문] [코드]
- Xpersona : "Xpersona : 다국어 개인 챗봇 평가". Arxiv (2020) [논문] [데이터]
- KVPI : "오픈 도메인 대화 에이전트에 대한 프로필 일관성 식별". EMNLP (2020) [논문] [코드]
- GDR : "생성, 삭제 및 재 작성 : 대화 생성의 페르소나 일관성을 향상시키기위한 3 단계 프레임 워크". ACL (2020) [종이]
- p^2bot : "당신은 나를 감동시킵니다 : 상호 페르소나 인식을 통한 대화 세대". ACL (2020) [논문] [코드]
- RCDG : "자연어 추론을 악용하여 페르소나 일관된 대화를 생성". AAAI (2020) [논문] [코드]
- Persona-Sparse : "Persona-Sparse 데이터를 가진 사전 훈련 기반 개인화 대화 생성 모델". AAAI (2020) [종이]
- Personawae : "증강 된 Wasserstein Autoencoders를 통한 응답 생성을위한 지속적인 공간에서의 개인화 모델링". Emnlp (2019) [종이]
- PAML : "메타 학습을 통한 대화 에이전트 개인화". ACL (2019) [논문] [코드]
- Personachat : "개인화 대화 요원 : 나도 개가있어 애완 동물도 있어요?" ACL (2018) [종이] [데이터]
- PCCM : "일관된 대화 생성을 위해 채팅 기계에 성격/프로필을 할당". IJCAI (2018) [종이]
? 위로 돌아갑니다
정서적 대화
정서적 지원 대화
- 선호 편견 : "대형 언어 모델이 정서적 지지자가 될 수 있습니까? 감정적 지원 대화에 대한 선호 편견을 완화 할 수 있습니다." ACL (2024) [종이]
- Escot : "ESCOT : 해석 가능한 정서적 지원 대화 시스템을 향해". ACL (2024) [논문] [코드]
- 머핀 : "머핀 : 다각적 인 AI 피드백으로 정서적 지원 대화에서 도움이되지 않음". ACL 찾기 (2024) [논문] [코드]
- DDRCU : "정서적 지원 대화에 대한 역동적 인 데모 검색 및인지 이해". Sigir (2024) [논문] [코드]
- KEMI : "정서적 지원 대화를위한 지식이 강화 된 혼합 연합 대화 시스템". ACL (2023) [논문] [코드]
- CSCONV : "인지 장애가있는 장로들을위한 다중 소스 지식 융합을 가진인지 자극 대화 시스템". ACL (2023) [논문] [코드]
- Augesc : "Augesc : 정서적 지원 대화를위한 큰 언어 모델을 가진 대화 확대". ACL 찾기 (2023) [종이]
- chensesc : "혐오 : 턴 레벨 상태 전환을 통한 감정적 지원 대화를 평활화". ACL 찾기 (2023) [논문] [코드]
- PAL : "PAL : 페르소나를 섭취 한 정서적 지원 대화 생성". ACL 찾기 (2023) [논문] [코드]
- MultiesC : "Lookahead 전략 계획을 통한 다중 회전 정서적 지원 대화 생성 개선". EMNLP (2022) [논문] [코드]
- 기타 : "기타 : 정서적 지원 대화를위한 혜성을 통합하는 혼합 전략 인식 모델". ACL (2022) [논문] [코드]
- C3KG : "C3KG : 중국 상식 대화 지식 그래프". ACL 찾기 (2022) [논문] [데이터]
- GLHG : "전 세계적으로 통제하고, 현지에서 이해하십시오 : 감정적 지원 대화를위한 글로벌-로컬 계층 적 그래프 네트워크". IJCAI (2022) [종이]
- Esconv : "정서적 지원 대화 시스템으로". ACL (2021) [논문] [데이터]
공감적인 대화
- Stickerconv : "Stickerconv : 처음부터 멀티 모달 공감 반응 생성". ACL (2024) [논문] [데이터]
- PerceptiveAgent : "인간과 같은 작용제와 대화 : 지각 가능한 음향 수신과 반응을 통한 공감 대화". ACL (2024) [논문] [코드]
- e-core : "e-core : 감정 상관 관계 강화 공감 대화 생성"EMNLP (2023) [논문]
- Empsoa : "자신을 잃지 마십시오! 명백한 자기 기타 인식을 통해 공감 대응 생성". ACL 찾기 (2023) [논문] [코드]
- 사례 : "사례 : 공감 반응 생성에 대한 거친 인식과 애정을 정렬합니다". ACL (2023) [논문] [코드]
- 치료 : "치료 : 조건부 그래프 생성에 의한 공감 반응에 대한 인과 관계". Emnlp-findings (2022) [논문] [코드]
- EMPGPT-3 : "GPT-3은 공감 대화를 생성합니까? 공감 대화 생성을위한 새로운 텍스트 예제 선택 방법 및 자동 평가 지표". Coling (2022) [논문] [코드]
- Posemodial : "긍정적 인 감정의 추론을 가진 다중 회전 공감 대화에". Arxiv (2022) [종이]
- CEM : "CEM : 상식 인식 공감 대응 생성". AAAI (2022) [논문] [코드]
- Gee : "감정 원인에 중점을 둔 공감 반응을 생성하기위한 관점과 실용주의". EMNLP (2021) [논문] [코드]
- Recec : "대화에서 감정 원인을 인식하여 공감 대응 생성 개선". Emnlp-findings (2021) [논문] [코드]
- COMAE : "Comae : 공감 응답 생성을위한 다단계 계층 적 프레임 워크". ACL 찾기 (2021) [논문] [코드]
- 치료 : "치료 : 잠재적 개념을 가진 상식 인식 정서적 반응 생성". AAAI (2021) [논문] [코드]
- EMPDG : "EMPDG : 다중 해상도 대화식 공감 대화 생성". Coling (2020) [논문] [코드]
- Mime : "Mime : 공감 반응 생성을위한 감정을 모방합니다". EMNLP (2020) [논문] [코드]
- PEC : "페르소나 기반의 공감 대화 모델을 향해". EMNLP (2020) [논문] [코드]
- Moel : "Moel : 공감 청취자의 혼합". EMNLP (2019) [논문] [코드]
- EmpatheticDialogues : "공감 오픈 도메인 대화 모델을 향해 : 새로운 벤치 마크 및 데이터 세트". ACL (2019) [종이] [데이터]
- Emods : "대화에서 특정 감정으로 응답을 생성". ACL (2019) [종이]
- Mojitalk : "Mojitalk : 규모에 따라 감정적 반응 생성". ACL (2018) [종이]
- ECM : "정서적 채팅 기계 : 내부 및 외부 기억을 가진 감정적 대화 생성". AAAI (2018) [논문] [코드]
? 위로 돌아갑니다
추천 대화 및 CR
- TCP-DIAL : "팔로우 : 목표 중심 추천 대화 시스템을위한 대화 계획". Arxiv (2022) [논문] [코드]
- KERS : "KERS : 여러 하위 목표를 가진 추천 대화 시스템을위한 지식 강화 프레임 워크". Emnlp-findings (2021) [논문] [코드]
- durecdial2.0 : "Durecdial 2.0 : 대화 추천을위한 이중 언어 평행 코퍼스". EMNLP (2021) [논문] [코드]
- DURECDIAL : "다형 대화 상자에 대한 대화 추천을 향한". ACL (2020) [논문] [코드]
- TG-REDIAL : "주제 유도 대화 추천 시스템으로". Coling (2020) [논문] [코드]
- 영감 : "영감 : 사교적 추천 대화 시스템을 향해". EMNLP (2020) [종이] [데이터]
- Gorecdial : "커뮤니케이션 게임으로서의 추천 : 골 중심 대화를위한 자체 감독 봇 플레이". EMNLP (2019) [논문] [코드]
- CRS-SURVEY : "대화식 추천 시스템에 대한 설문 조사". ACM 컴퓨팅 설문 조사 (2021) [논문]
- CRS-Survey : "대화 상대 추천 시스템의 발전과 과제 : 설문 조사". Arxiv (2021) [종이]
- CRSLAB : "CRSLAB : 대화 권장자 시스템 구축을위한 오픈 소스 툴킷". Arxiv (2021) [논문] [코드]
- Mese : "상황 인식 항목 메타 정보를 사용한 대화 추천 시스템의 품질 향상". NaaCl (2022) [논문] [코드]
- C2-CRS : "C2-CRS : 대화 상대 추천 시스템을위한 거친 대조적 인 학습". WSDM (2022) [논문] [코드]
- BotPlay : "Self-Supervised Bot Play for Conversational Recommendation with Justifications". arXiv(2021) [paper]
- RID : "Finetuning Large-Scale Pre-trained Language Models for Conversational Recommendation with Knowledge Graph". arXiv(2021) [paper] [code]
- CRFR : "CRFR: Improving Conversational Recommender Systems via Flexible Fragments Reasoning on Knowledge Graphs". EMNLP(2021) [paper]
- NTRD : "Learning Neural Templates for Recommender Dialogue System". EMNLP(2021) [paper] [code]
- CR-Walker : "CR-Walker: Tree-Structured Graph Reasoning and Dialog Acts for Conversational Recommendation". EMNLP(2021) [paper] [code]
- RevCore : "RevCore: Review-augmented Conversational Recommendation". ACL-Findings(2021) [paper] [code]
- KECRS : "KECRS: Towards Knowledge-Enriched Conversational Recommendation System". arXiv(2021) [paper]
- FPAN : "Adapting User Preference to Online Feedback in Multi-round Conversational Recommendation". WSDM(2021) [paper] [code]
- UNICORN : "Unified Conversational Recommendation Policy Learning via Graph-based Reinforcement Learning". SIGIR(2021) [paper] [code]
- KGSF : "Improving Conversational Recommender Systems via Knowledge Graph based Semantic Fusion". KDD(2020) [paper] [code]
- CPR : "Interactive Path Reasoning on Graph for Conversational Recommendation". KDD(2020) [paper] [code]
- EAR : "Estimation-Action-Reflection: Towards Deep Interaction Between Conversational and Recommender Systems". WSDM(2020) [paper] [code]
- KBRD : "Towards Knowledge-Based Recommender Dialog System". EMNLP(2019) [paper] [code]
- ReDial : "Towards Deep Conversational Recommendations". NeurIPS(2018) [paper] [data]
? Back to Top
Knowledge-grounded Dialogue
- DOCTOR : "Dialogue Chain-of-Thought Distillation for Commonsense-aware Conversational Agents". EMNLP(2023) [paper] [code] [demo]
- GATE : "Well Begun is Half Done: Generator-agnostic Knowledge Pre-Selection for Knowledge-Grounded Dialogue". EMNLP(2023) [paper] [code]
- CONNER : "Beyond Factuality: A Comprehensive Evaluation of Large Language Models as Knowledge Generators". EMNLP(2023) [paper] [code]
- K-DIAL : "Improving Factual Consistency for Knowledge-Grounded Dialogue Systems via Knowledge Enhancement and Alignment". EMNLP-Findings(2023) [paper]
- GLM-Dialog : "GLM-Dialog: Noise-tolerant Pre-training for Knowledge-grounded Dialogue Generation". arXiv(2023) [paper] [code]
- RHO : "RHO (ρ): Reducing Hallucination in Open-domain Dialogues with Knowledge Grounding". ACL-Findings(2023) [paper] [code]
- MultiRefKGC : "There Is No Standard Answer: Knowledge-Grounded Dialogue Generation with Adversarial Activated Multi-Reference Learning". EMNLP(2022) [paper] [code]
- CorefDiffs : "CorefDiffs: Co-referential and Differential Knowledge Flow in Document Grounded Conversations". COLING(2022) [paper] [code]
- DTR : "Stylized Knowledge-Grounded Dialogue Generation via Disentangled Template Rewriting". NAACL(2022) [paper] [code]
- XDAI : "XDAI: A Tuning-free Framework for Exploiting Pre-trained Language Models in Knowledge Grounded Dialogue Generation". KDD(2022) [paper] [code]
- PersonaKGC : "There Are a Thousand Hamlets in a Thousand People's Eyes: Enhancing Knowledge-grounded Dialogue with Personal Memory". ACL(2022) [paper] [code]
- KI : "Lexical Knowledge Internalization for Neural Dialog Generation". ACL(2022) [paper] [code]
- DiffKG : "Towards Large-Scale Interpretable Knowledge Graph Reasoning for Dialogue Systems". ACL-Findings(2022) [paper] [code]
- KSAM : "KSAM: Infusing Multi-Source Knowledge into Dialogue Generation via Knowledge Source Aware Multi-Head Decoding". ACL-Findings(2022) [paper]
- MDSP : "Multi-Stage Prompting for Knowledgeable Dialogue Generation". ACL-Findings(2022) [paper] [code]
- FSB : "Few-Shot Bot: Prompt-Based Learning for Dialogue Systems". arXiv(2021) [paper] [code]
- P-GDG : "Exploring Prompt-based Few-shot Learning for Grounded Dialog Generation". arXiv(2021) [paper]
- KAT-TSLF : "A Three-Stage Learning Framework for Low-Resource Knowledge-Grounded Dialogue Generation". EMNLP(2021) [paper] [code]
- DIALKI : "DIALKI: Knowledge Identification in Conversational Systems through Dialogue-Document Contextualization". EMNLP(2021) [paper] [code]
- CoLV : "CoLV: A Collaborative Latent Variable Model for Knowledge-Grounded Dialogue Generation". EMNLP(2021) [paper]
- SKT-KG : "Augmenting Knowledge-grounded Conversations with Sequential Knowledge Transition". NAACL(2021) [paper]
- MSKE : "More is Better: Enhancing Open-Domain Dialogue Generation via Multi-Source Heterogeneous Knowledge". EMNLP(2021) [paper] [code]
- EARL : "EARL: Informative Knowledge-Grounded Conversation Generation with Entity-Agnostic Representation Learning". EMNLP(2021) [paper] [code]
- KGD-CF : "Increasing Faithfulness in Knowledge-Grounded Dialogue with Controllable Features". ACL(2021) [paper]
- SECE : "Space Efficient Context Encoding for Non-Task-Oriented Dialogue Generation with Graph Attention Transformer". ACL(2021) [paper] [code]
- MIKe : "Initiative-Aware Self-Supervised Learning for Knowledge-Grounded Conversations". SIGIR(2021) [paper] [code]
- GOKC : "Learning to Copy Coherent Knowledge for Response Generation". AAAI(2021) [paper] [code]
- KnowledGPT : "Knowledge-Grounded Dialogue Generation with Pre-trained Language Models". EMNLP(2020) [paper] [code]
- DiffKS : "Difference-aware Knowledge Selection for Knowledge-grounded Conversation Generation". EMNLP-Findings(2020) [paper] [code]
- DukeNet : "DukeNet: A Dual Knowledge Interaction Network for Knowledge-Grounded Conversation". SIGIR(2020) [paper] [code]
- CCN : "Cross Copy Network for Dialogue Generation". EMNLP(2020) [paper] [code]
- PIPM : "Bridging the Gap between Prior and Posterior Knowledge Selection for Knowledge-Grounded Dialogue Generation". EMNLP(2020) [paper]
- ConceptFlow : "Grounded Conversation Generation as Guided Traverses in Commonsense Knowledge Graphs". ACL(2020) [paper] [code]
- ConKADI : "Diverse and Informative Dialogue Generation with Context-Specific Commonsense Knowledge Awareness". ACL(2020) [paper] [code]
- KIC : "Generating Informative Conversational Response using Recurrent Knowledge-Interaction and Knowledge-Copy". ACL(2020) [paper]
- SKT : "Sequential Latent Knowledge Selection for Knowledge-Grounded Dialogue". ICLR(2020) [paper] [code]
- KdConv : "KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn Knowledge-driven Conversation". ACL(2020) [paper] [data]
- TransDG : "Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering". AAAI(2020) [paper] [code]
- RefNet : "RefNet: A Reference-aware Network for Background Based Conversation". AAAI(2020) [paper] [code]
- GLKS : "Thinking Globally, Acting Locally: Distantly Supervised Global-to-Local Knowledge Selection for Background Based Conversation". AAAI(2020) [paper] [code]
- AKGCM : "Knowledge Aware Conversation Generation with Explainable Reasoning over Augmented Graphs". EMNLP(2019) [paper] [code]
- DyKgChat : "DyKgChat: Benchmarking Dialogue Generation Grounding on Dynamic Knowledge Graphs". EMNLP(2019) [paper] [code]
- OpenDialKG : "OpenDialKG: Explainable Conversational Reasoning with Attention-based Walks over Knowledge Graphs". ACL(2019) [paper] [data]
- WoW : "Wizard of Wikipedia: Knowledge-Powered Conversational agents". ICLR(2019) [paper]
- PostKS : "Learning to Select Knowledge for Response Generation in Dialog Systems". IJCAI(2019) [paper] [code-1] [code-2]
- NKD : "Knowledge Diffusion for Neural Dialogue Generation". ACL(2018) [paper] [data]
- Dual Fusion : "Smarter Response with Proactive Suggestion: A New Generative Neural Conversation Paradigm". IJCAI(2018) [paper]
- CCM : "Commonsense Knowledge Aware Conversation Generation with Graph Attention". IJCAI(2018) [paper] [code-tf] [code-py]
- MTask : "A Knowledge-Grounded Neural Conversation Model". AAAI(2018) [paper]
- GenDS : "Flexible End-to-End Dialogue System for Knowledge Grounded Conversation". arXiv(2017) [paper]
? Back to Top
Task-oriented Dialogue
- P-ToD : "Personalizing Task-oriented Dialog Systems via Zero-shot Generalizable Reward Function". CIKM(2022) [paper]
- Dialogic : "Dialogic: Controllable Dialogue Simulation with In-Context Learning". EMNLP-Findings(2022) [paper] [code]
- KB-Adapter : "Injecting Domain Knowledge in Language Models for Task-Oriented Dialogue Systems". EMNLP(2022) [paper] [code]
- TacoBot : "Bootstrapping a User-Centered Task-Oriented Dialogue System". Proceedings of Alexa Prize TaskBot(2021) [paper]
- USDA : "User Satisfaction Estimation with Sequential Dialogue Act Modeling in Goal-oriented Conversational Systems". WWW(2022) [paper] [code]
- USS : "Simulating User Satisfaction for the Evaluation of Task-oriented Dialogue Systems". SIGIR(2021) [paper] [data]
- NS-Dial : "An Interpretable Neuro-Symbolic Reasoning Framework for Task-Oriented Dialogue Generation". ACL(2022) [paper] [code]
- GALAXY : "GALAXY: A Generative Pre-trained Model for Task-Oriented Dialog with Semi-Supervised Learning and Explicit Policy Injection". AAAI(2022) [paper] [code]
- PPTOD : "Multi-Task Pre-Training for Plug-and-Play Task-Oriented Dialogue System". arXiv(2021) [paper] [code]
- ToDCL : "Continual Learning in Task-Oriented Dialogue Systems". EMNLP(2021) [paper] [code]
- IR-Net : "Intention Reasoning Network for Multi-Domain End-to-end Task-Oriented Dialogue". EMNLP(2021) [paper]
- HyKnow : "HyKnow: End-to-End Task-Oriented Dialog Modeling with Hybrid Knowledge Management". ACL-Findings(2021) [paper] [code]
- DDMN : "Dual Dynamic Memory Network for End-to-End Multi-turn Task-oriented Dialog Systems". COLING(2020) [paper] [code]
- ToD-BERT : "ToD-BERT: Pre-trained Natural Language Understanding for Task-Oriented Dialogues". EMNLP(2020) [paper] [code]
- GraphDialog : "GraphDialog: Integrating Graph Knowledge into End-to-End Task-Oriented Dialogue Systems". EMNLP(2020) [paper] [code]
- MARCO : "Multi-Domain Dialogue Acts and Response Co-Generation". ACL(2020) [paper] [code]
- DF-Net : "Dynamic Fusion Network for Multi-Domain End-to-end Task-Oriented Dialog". ACL(2020) [paper] [code]
- MALA : "MALA: Cross-Domain Dialogue Generation with Action Learning". AAAI(2020) [paper]
- SGD : "Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset". AAAI(2020) [paper] [data]
- CrossWOZ : "CrossWOZ: A Large-Scale Chinese Cross-Domain Task-Oriented Dialogue Dataset". TACL(2020) [paper] [code]
- MultiWOZ : "MultiWOZ - A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling". EMNLP(2018) [paper] [code]
- Neural Task-Oriented Dialogue : "Learning to Memorize in Neural Task-Oriented Dialogue Systems". MPhil Thesis(2019) [paper]
- GLMP : "Global-to-local Memory Pointer Networks for Task-Oriented Dialogue". ICLR(2019) [paper] [code]
- KB Retriever : "Entity-Consistent End-to-end Task-Oriented Dialogue System with KB Retriever". EMNLP(2019) [paper] [data]
- TRADE : "Transferable Multi-Domain State Generator for Task-Oriented Dialogue Systems". ACL(2019) [paper] [code]
- WMM2Seq : "A Working Memory Model for Task-oriented Dialog Response Generation". ACL(2019) [paper]
- Pretrain-Fine-tune : "Training Neural Response Selection for Task-Oriented Dialogue Systems". ACL(2019) [paper] [data]
- Multi-level Mem : "Multi-Level Memory for Task Oriented Dialogs". NAACL(2019) [paper] [code]
- BossNet : "Disentangling Language and Knowledge in Task-Oriented Dialogs ". NAACL(2019) [paper] [code]
- SDN : "Subgoal Discovery for Hierarchical Dialogue Policy Learning". EMNLP(2018) [paper]
- D3Q : "Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning". EMNLP(2018) [paper] [code]
- DDQ : "Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning". ACL(2018) [paper] [code]
- MAD : "Memory-augmented Dialogue Management for Task-oriented Dialogue Systems". TOIS(2018) [paper]
- TSCP : "Sequicity: Simplifying Task-oriented Dialogue Systems with Single Sequence-to-Sequence Architectures". ACL(2018) [paper] [code]
- Mem2Seq : "Mem2Seq: Effectively Incorporating Knowledge Bases into End-to-End Task-Oriented Dialog Systems". ACL(2018) [paper] [code]
- Topic-Seg-Label : "A Weakly Supervised Method for Topic Segmentation and Labeling in Goal-oriented Dialogues via Reinforcement Learning". IJCAI(2018) [paper] [code]
- AliMe : "AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine". ACL(2017) [paper]
- KVR Net : "Key-Value Retrieval Networks for Task-Oriented Dialogue". SIGDIAL(2017) [paper] [data]
? Back to Top
Open-domain Dialogue
Long-term Dialogue
- THEANINE : "THEANINE: Revisiting Memory Management in Long-term Conversations with Timeline-augmented Response Generation". arXiv(2024) [paper]
- LD-Agent : "Hello Again! LLM-powered Personalized Agent for Long-term Dialogue". arXiv(2024) [paper] [code]
- CPD : "Position Debiasing Fine-Tuning for Causal Perception in Long-Term Dialogue". IJCAI(2024) [paper]
- TemporalMemory : "Toward Conversational Agents with Context and Time Sensitive Long-term Memory". arXiv(2024) [paper] [data]
- LoCoMo : "Evaluating Very Long-Term Conversational Memory of LLM Agents". ACL(2024) [paper] [data]
- Conversation Chronicles : "Conversation Chronicles: Towards Diverse Temporal and Relational Dynamics in Multi-Session Conversations". EMNLP(2023) [paper] [data]
- GapChat : "Mind the Gap Between Conversations for Improved Long-Term Dialogue Generation". EMNLP-Findings(2023) [paper] [data]
- UniMC : "UniMC: A Unified Framework for Long-Term Memory Conversation via Relevance Representation Learning". arXiv(2023) [paper]
- RS : "Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models". arXiv(2023) [paper]
- MSC : "Beyond Goldfish Memory: Long-Term Open-Domain Conversation". ACL(2022) [paper] [data]
Response Generation
- Overview : "Open-domain Dialogue Generation: What We Can Do, Cannot Do, And Should Do Next". ACL-NLP4ConvAI(2022) [paper]
- Chirpy Cardinal : "Neural Generation Meets Real People: Building a Social, Informative Open-Domain Dialogue Agent". SIGDIAL(2022) [paper] [code] [project]
- TIL : "Towards Efficient Dialogue Pre-training with Transferable and Interpretable Latent Structure". EMNLP(2022) [paper]
- ProphetChat : "ProphetChat: Enhancing Dialogue Generation with Simulation of Future Conversation". ACL(2022) [paper]
- DialoFlow : "Conversations Are Not Flat: Modeling the Dynamic Information Flow across Dialogue Utterances". ACL(2021) [paper] [code]
- DiSCoL : "DiSCoL: Toward Engaging Dialogue Systems through Conversational Line Guided Response Generation". NAACL(2021) [paper] [code]
- DialogBERT : "DialogBERT: Discourse-Aware Response Generation via Learning to Recover and Rank Utterances". AAAI(2021) [paper]
- BlenderBot : "Recipes for Building an Open-Domain Chatbot". EACL(2021) [paper] [code]
- CDial-GPT : "A Large-Scale Chinese Short-Text Conversation Dataset". NLPCC(2020) [paper] [code]
- DialoGPT : "DialoGPT : Large-Scale Generative Pre-training for Conversational Response Generation". ACL(2020) [paper] [code]
- CG-Policy : "Conversational Graph Grounded Policy Learning for Open-Domain Conversation Generation". ACL(2020) [paper]
- PLATO-XL : "PLATO-XL: Exploring the Large-scale Pre-training of Dialogue Generation". arXiv(2021) [paper] [code]
- PLATO-2 : "PLATO-2: Towards Building an Open-Domain Chatbot via Curriculum Learning". ACL-Findings(2021) [paper] [code]
- PLATO : "PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable". ACL(2020) [paper] [code]
- Guyu : "An Empirical Investigation of Pre-Trained Transformer Language Models for Open-Domain Dialogue Generation". arXiv(2020) [paper] [code]
- CL4Dialogue : "Group-wise Contrastive Learning for Neural Dialogue Generation". EMNLP-Findings(2020) [paper] [code]
- Neg-train : "Negative Training for Neural Dialogue Response Generation". ACL(2020) [paper] [code]
- HDSA : "Semantically Conditioned Dialog Response Generation via Hierarchical Disentangled Self-Attention". ACL(2019) [paper] [code]
- CAS : "Skeleton-to-Response: Dialogue Generation Guided by Retrieval Memory". NAACL(2019) [paper] [code]
- Edit-N-Rerank : "Response Generation by Context-aware Prototype Editing". AAAI(2019) [paper] [code]
- HVMN : "Hierarchical Variational Memory Network for Dialogue Generation". WWW(2018) [paper] [code]
- XiaoIce : "The Design and Implementation of XiaoIce, an Empathetic Social Chatbot". arXiv(2018) [paper]
- D2A : "Dialog-to-Action: Conversational Question Answering Over a Large-Scale Knowledge Base". NeurIPS(2018) [paper] [code]
- DAIM : "Generating Informative and Diverse Conversational Responses via Adversarial Information Maximization". NeurIPS(2018) [paper]
- REASON : "Dialog Generation Using Multi-turn Reasoning Neural Networks". NAACL(2018) [paper]
- STD/HTD : "Learning to Ask Questions in Open-domain Conversational Systems with Typed Decoders". ACL(2018) [paper] [code]
- CSF : "Generating Informative Responses with Controlled Sentence Function". ACL(2018) [paper] [code]
- DAWnet : "Chat More: Deepening and Widening the Chatting Topic via A Deep Model". SIGIR(2018) [paper] [code]
- ZSDG : "Zero-Shot Dialog Generation with Cross-Domain Latent Actions". SIGDIAL(2018) [paper] [code]
- DUA : "Modeling Multi-turn Conversation with Deep Utterance Aggregation". COLING(2018) [paper] [code]
- Data-Aug : "Sequence-to-Sequence Data Augmentation for Dialogue Language Understanding". COLING(2018) [paper] [code]
- DC-MMI : "Generating More Interesting Responses in Neural Conversation Models with Distributional Constraints". EMNLP(2018) [paper] [code]
- cVAE-XGate/CGate : "Better Conversations by Modeling, Filtering, and Optimizing for Coherence and Diversity". EMNLP(2018) [paper] [code]
- Retrieval+multi-seq2seq : "An Ensemble of Retrieval-Based and Generation-Based Human-Computer Conversation Systems". IJCAI(2018) [paper]
- DAM : "Multi-Turn Response Selection for Chatbots with Deep Attention Matching Network". ACL(2018) [paper] [code]
- SMN : "Sequential Matching Network: A New Architecture for Multi-turn Response Selection in Retrieval-Based Chatbots". ACL(2017) [paper] [code]
- CVAE/KgCVAE : "Learning Discourse-level Diversity for Neural Dialog Models using Conditional Variational Autoencoders". ACL(2017) [paper] [code]
- TA-Seq2Seq : "Topic Aware Neural Response Generation". AAAI(2017) [paper] [code]
- MA : "Mechanism-Aware Neural Machine for Dialogue Response Generation". AAAI(2017) [paper]
- VHRED : "A Hierarchical Latent Variable Encoder-Decoder Model for Generating Dialogues". AAAI(2017) [paper] [code]
- HRED : "Building End-To-End Dialogue Systems Using Generative Hierarchical Neural Network Models". AAAI(2016) [paper] [code]
- RL-Dialogue : "Deep Reinforcement Learning for Dialogue Generation". EMNLP(2016) [paper]
- MMI : "A Diversity-Promoting Objective Function for Neural Conversation Models". NAACL(2016) [paper] [code]
? Back to Top
Dialogue Evaluation
- DialogBench : "DialogBench: Evaluating LLMs as Human-like Dialogue Systems". NAACL(2024) [paper] [code]
- ChatEval : "ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate". arXiv(2023) [paper] [code]
- ACCENT : "ACCENT: An Automatic Event Commonsense Evaluation Metric for Open-Domain Dialogue Systems". ACL(2023) [paper] [code]
- LLMEval : "Understanding the Effectiveness of Very Large Language Models on Dialog Evaluation". IWSDS(2023) [paper]
- ChatEvalPlatform : "Don't Forget Your ABC's: Evaluating the State-of-the-Art in Chat-Oriented Dialogue Systems". arXiv(2022) [paper] [code]
- MDD-Eval : "MDD-Eval: Self-Training on Augmented Data for Multi-Domain Dialogue Evaluation". AAAI(2022) [paper] [code]
- Self-Eval : "SelF-Eval: Self-supervised Fine-grained Dialogue Evaluation". COLING(2022) [paper] [code]
- FineD-Eval : "FineD-Eval: Fine-grained Automatic Dialogue-Level Evaluation". EMNLP(2022) [paper] [code]
- FlowEval : "FlowEval: A Consensus-Based Dialogue Evaluation Framework Using Segment Act Flows". EMNLP(2022) [paper]
- IM2 : "IM^2: an Interpretable and Multi-category Integrated Metric Framework for Automatic Dialogue Evaluation". EMNLP(2022) [paper] [code]
- Q^2 : "$Q^{2}$: Evaluating Factual Consistency in Knowledge-Grounded Dialogues via Question Generation and Question Answering". EMNLP(2021) [paper] [code]
- QuantiDCE : "Towards Quantifiable Dialogue Coherence Evaluation". ACL(2021) [paper] [code]
- DynaEval : "DynaEval: Unifying Turn and Dialogue Level Evaluation". ACL(2021) [paper] [code]
- Review : "How to Evaluate Your Dialogue Models: A Review of Approaches". arXiv(2021) [paper]
- ConvLabEval : "Is Your Goal-Oriented Dialog Model Performing Really Well? Empirical Analysis of System-wise Evaluation". SIGDIAL(2020) [paper]
- FED : "Unsupervised Evaluation of Interactive Dialog with DialoGPT". SIGDIAL(2020) [paper] [code] [data]
- Spot-the-Bot : "Spot The Bot: A Robust and Efficient Framework for the Evaluation of Conversational Dialogue Systems". EMNLP(2020) [paper] [code]
- CMADE : "Beyond User Self-Reported Likert Scale Ratings: A Comparison Model for Automatic Dialog Evaluation". ACL(2020) [paper] [code]
- Coherence : "Dialogue Coherence Assessment Without Explicit Dialogue Act Labels". ACL(2020) [paper] [code]
- MAUDE : "Learning an Unreferenced Metric for Online Dialogue Evaluation". ACL(2020) [paper] [code]
- GRADE : "GRADE: Automatic Graph-Enhanced Coherence Metric for Evaluating Open-Domain Dialogue Systems". ACL(2020) [paper] [code]
- uBLEU : "uBLEU: Uncertainty-Aware Automatic Evaluation Method for Open-Domain Dialogue Systems". ACL(2020) [paper] [code]
- USR : "USR: An Unsupervised and Reference Free Evaluation Metric for Dialog Generation". ACL(2020) [paper] [code]
- ACUTE-EVAL : "ACUTE-EVAL: Improved Dialogue Evaluation with Optimized Questions and Multi-turn Comparisons". NIPS ConvAI Workshop(2019) [paper] [code]
- InteractiveEval : "Approximating Interactive Human Evaluation with Self-Play for Open-Domain Dialog Systems". NeurIPS(2019) [paper] [code]
- ChatEval : "ChatEval: A Tool for Chatbot Evaluation". NAACL(2019) [paper] [project]
- ADVMT : "One
Ruler for All Languages: Multi-Lingual Dialogue Evaluation with Adversarial Multi-Task Learning". IJCAI(2018) [paper]
? Back to Top
Dialogue Misc.
- Signed-dialogue : "Generating Signed Language Instructions in Large-Scale Dialogue Systems". NAACL(2024) [paper] [data]
- Dialogue-KT : "Exploring Knowledge Tracing in Tutor-Student Dialogues". arXiv(2024) [paper] [code]
- MathDial : "MathDial: A Dialogue Tutoring Dataset with Rich Pedagogical Properties Grounded in Math Reasoning Problems". EMNLP-Findings(2023) [paper] [data]
- EduChat : "EduChat: A Large-Scale Language Model-based Chatbot System for Intelligent Education". arXiv(2023) [paper] [code]
- ACT : "Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training". arXiv(2024) [paper]
- ReviewMT : "Peer Review as A Multi-Turn and Long-Context Dialogue with Role-Based Interactions". arXiv(2024) [paper] [code]
- WildChat : "WildChat: 1M ChatGPT Interaction Logs in the Wild". ICLR(2024) [paper] [data]
- DialOp : "Decision-Oriented Dialogue for Human-AI Collaboration". arXiv(2023) [paper] [code]
- DialogStudio : "DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection for Conversational AI". arXiv(2023) [paper] [code]
- MPC : "Multi-Party Chat: Conversational Agents in Group Settings with Humans and Models". arXiv(2023) [paper] [code]
- SODA : "SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization". EMNLP(2023) [paper] [code]
- speaker-adaptation : "Speaking the Language of Your Listener: Audience-Aware Adaptation via Plug-and-Play Theory of Mind". ACL-Findings(2023) [paper] [code]
- SocialDial : "SocialDial: A Benchmark for Socially-Aware Dialogue Systems". SIGIR(2023) [paper] [data]
- BotsTalk : "BotsTalk: Machine-sourced Framework for Automatic Curation of Large-scale Multi-skill Dialogue Datasets". EMNLP(2022) [paper] [code]
- Dialogic : "Dialogic: Controllable Dialogue Simulation with In-Context Learning". EMNLP-Findings(2022) [paper] [code]
- ProsocialDialog : "ProsocialDialog: A Prosocial Backbone for Conversational Agents". EMNLP(2022) [paper] [code]
- MIC : "The Moral Integrity Corpus: A Benchmark for Ethical Dialogue Systems". ACL(2022) [paper] [code]
- MoralDial : "MoralDial: A Framework to Train and Evaluate Moral Dialogue Systems via Constructing Moral Discussions". arXiv(2022) [paper]
- DECODE : "I like fish, especially dolphins: Addressing Contradictions in Dialogue Modeling". ACL(2021) [paper] [code]
? Back to Top
Natural Language Generation
Survey on NLG
- CTG : "A Survey of Controllable Text Generation using Transformer-based Pre-trained Language Models". arXiv(2022) [paper]
- RTG : "A Survey on Retrieval-Augmented Text Generation". arXiv(2022) [paper]
- Hallucination : "Survey of Hallucination in Natural Language Generation". arXiv(2022) [paper]
- Evaluation : "A Survey of Evaluation Metrics Used for NLG Systems". arXiv(2020) [paper]
? Back to Top
NLG Theories and Techniques
- RED : "Decoder-Only or Encoder-Decoder? Interpreting Language Model as a Regularized Encoder-Decoder". arXiv(2023) [paper]
- LaMemo : "LaMemo: Language Modeling with Look-Ahead Memory". NAACL(2022) [paper] [code]
- PTG : "Learning to Transfer Prompts for Text Generation". NAACL(2022) [paper] [code]
- EISL : "Don't Take It Literally: An Edit-Invariant Sequence Loss for Text Generation". NAACL(2022) [paper] [code]
- CT-Loss : "A Simple Contrastive Learning Objective for Alleviating Neural Text Degeneration". arXiv(2022) [paper] [code]
- SimCTG : "A Contrastive Framework for Neural Text Generation". NeurIPS(2022) [paper] [code]
- CoNT : "CoNT: Contrastive Neural Text Generation". NeurIPS(2022) [paper] [code]
- Two-level-CL : "Keywords and Instances: A Hierarchical Contrastive Learning Framework Unifying Hybrid Granularities for Text Generation". ACL(2022) [paper]
- CLAPS : "Contrastive Learning with Adversarial Perturbations for Conditional Text Generation". ICLR(2021) [paper] [code]
- RetGen : "RetGen: A Joint framework for Retrieval and Grounded Text Generation Modeling". AAAI(2022) [paper] [code]
- RAG : "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks". NeurIPS(2020) [paper] [code]
- TextGAIL : "TextGAIL: Generative Adversarial Imitation Learning for Text Generation". AAAI(2021) [paper] [code]
- Latent-GLAT : " latent -GLAT: Glancing at Latent Variables for Parallel Text Generation". ACL(2022) [paper] [code]
- s2s-ft : "s2s-ft: Fine-Tuning Pretrained Transformer Encoders for Sequence-to-Sequence Learning". arXiv(2021) [paper] [code]
- EBM : "Exposure Bias versus Self-Recovery: Are Distortions Really Incremental for Autoregressive Text Generation?". EMNLP(2021) [paper]
- DiscoDVT : "DiscoDVT: Generating Long Text with Discourse-Aware Discrete Variational Transformer". EMNLP(2021) [paper] [code]
- DATG : "Data Augmentation for Text Generation Without Any Augmented Data". ACL(2021) [paper]
- JointGT : "JointGT: Graph-Text Joint Representation Learning for Text Generation from Knowledge Graphs". ACL-Findings(2021) [paper] [code]
- Embedding-Transfer : "Bridging Subword Gaps in Pretrain-Finetune Paradigm for Natural Language Generation". ACL(2021) [paper] [code]
- FastSeq : "EL-Attention: Memory Efficient Lossless Attention for Generation". ICML(2021) [paper] [code]
- BERTSeq2Seq : "Leveraging Pre-trained Checkpoints for Sequence Generation Tasks". TACL(2020) [paper] [code-tf] [code-py]
- ERNIE-GEN : "ERNIE-GEN: An Enhanced Multi-Flow Pre-training and Fine-tuning Framework for Natural Language Generation". IJCAI(2020) [paper] [code]
- DITTO : "Learning to Break the Loop: Analyzing and Mitigating Repetitions for Neural Text Generation". NeurIPS(2022) [paper] [code]
- Repetition-Problem : "A Theoretical Analysis of the Repetition Problem in Text Generation". AAAI(2021) [paper] [code]
- ENCONTER : "ENCONTER: Entity Constrained Progressive Sequence Generation via Insertion-based Transformer". EACL(2021) [paper] [code]
- POINTER : "POINTER: Constrained Progressive Text Generation via Insertion-based Generative Pre-training". EMNLP(2020) [paper] [code]
- Cascaded Generation : "Cascaded Text Generation with Markov Transformers". NeurIPS(2020) [paper] [code]
- SFOT : "Improving Text Generation with Student-Forcing Optimal Transport". EMNLP(2020) [paper]
- OT-Seq2Seq : "Improving Sequence-to-Sequence Learning via Optimal Transport". ICLR(2019) [paper] [code]
? Back to Top
Diffusion Models for NLG
- RenderDiffusion : "RenderDiffusion: Text Generation as Image Generation". arXiv(2023) [paper]
- Masked-Diffusion-LM : "A Cheaper and Better Diffusion Language Model with Soft-Masked Noise". arXiv(2023) [paper] [code]
- discrete-diffusion : "A Reparameterized Discrete Diffusion Model for Text Generation". arXiv(2023) [paper] [code]
- Difformer : "Difformer: Empowering Diffusion Models on the Embedding Space for Text Generation". arXiv(2023) [paper]
- GENIE : "Text Generation with Diffusion Language Models: A Pre-training Approach with Continuous Paragraph Denoise". arXiv(2022) [paper] [code]
- SED : "Self-conditioned Embedding Diffusion for Text Generation". arXiv(2022) [paper]
- SSD-LM : "SSD-LM: Semi-autoregressive Simplex-based Diffusion Language Model for Text Generation and Modular Control". arXiv(2022) [paper] [code]
- LD4LG : "Latent Diffusion for Language Generation". arXiv(2022) [paper] [code]
- DiffusionBERT : "DiffusionBERT: Improving Generative Masked Language Models with Diffusion Models". arXiv(2022) [paper] [code]
- DiffusER : "DiffusER: Discrete Diffusion via Edit-based Reconstruction". arXiv(2022) [paper] [code]
- SeqDiffuSeq : "SeqDiffuSeq: Text Diffusion with Encoder-Decoder Transformers". arXiv(2022) [paper] [code]
- DiffuSeq : "DiffuSeq: Sequence to Sequence Text Generation with Diffusion Models". ICLR(2023) [paper] [code]
- Diffusion-LM : "Diffusion-LM Improves Controllable Text Generation". NeurIPS(2022) [paper] [code]
- D3PM : "Structured Denoising Diffusion Models in Discrete State-Spaces". NeurIPS(2021) [paper] [code]
? Back to Top
Controllable Generation
- ConGenBench : "Controllable Text Generation in the Instruction-Tuning Era". arXiv(2024) [paper] [code]
- GeLaTo : "Tractable Control for Autoregressive Language Generation". arXiv(2023) [paper]
- Cognac : "Controllable Text Generation with Language Constraints". arXiv(2022) [paper] [code]
- CriticControl : "Critic-Guided Decoding for Controlled Text Generation". arXiv(2022) [paper]
- LatentOps : "Composable Text Controls in Latent Space with ODEs". arXiv(2022) [paper] [code]
- FAST : "FAST: Improving Controllability for Text Generation with Feedback Aware Self-Training". arXiv(2022) [paper]
- DisCup : "DisCup: Discriminator Cooperative Unlikelihood Prompt-tuning for Controllable Text Generation". EMNLP(2022) [paper] [code]
- MultiControl : "A Distributional Lens for Multi-Aspect Controllable Text Generation". EMNLP(2022) [paper] [code]
- NADO : "Controllable Text Generation with Neurally-Decomposed Oracle". NeurIPS(2022) [paper] [code]
- Mix-Match : "Mix and Match: Learning-free Controllable Text Generation using Energy Language Models". ACL(2022) [paper] [code]
- ControlPrefix : "Controllable Natural Language Generation with Contrastive Prefixes". ACL-Findings(2022) [paper]
- MUCOCO : "Controlled Text Generation as Continuous Optimization with Multiple Constraints". NeurIPS(2021) [paper] [code]
- DExperts : "DExperts: Decoding-Time Controlled Text Generation with Experts and Anti-Experts". ACL(2021) [paper] [code]
- FUDGE : "FUDGE: Controlled Text Generation With Future Discriminators". NAACL(2021) [paper] [code]
- GeDi : "GeDi: Generative Discriminator Guided Sequence Generation". EMNLP-Findings(2021) [paper] [code]
- GDC : "A Distributional Approach to Controlled Text Generation". ICLR(2021) [paper] [code]
- CoCon : "CoCon: A Self-Supervised Approach for Controlled Text Generation". ICLR(2021) [paper] [code]
- PPLM : "Plug and Play Language Models: A Simple Approach to Controlled Text Generation". ICLR(2020) [paper] [code]
- CTRL : "CTRL: A Conditional Transformer Language Model for Controllable Generation". arXiv(2019) [paper] [code]
? Back to Top
Text Planning
- CoScript : "Distilling Script Knowledge from Large Language Models for Constrained Language Planning". ACL(2023) [paper] [code]
- RSTGen : "RSTGen: Imbuing Fine-Grained Interpretable Control into Long-FormText Generators". NAACL(2022) [paper]
- Time Control : "Language Modeling via Stochastic Processes". ICLR(2022) [paper] [code]
- PLANET : "PLANET: Dynamic Content Planning in Autoregressive Transformers for Long-form Text Generation". ACL(2022) [paper]
- EventPlan : "Event Transition Planning for Open-ended Text Generation". ACL-Findings(2022) [paper] [code]
- CETP : "Knowledge-based Review Generation by Coherence Enhanced Text Planning". SIGIR(2021) [paper]
- PlanGen : "Plan-then-Generate: Controlled Data-to-Text Generation via Planning". EMNLP-Findings(2021) [paper] [code]
- DYPLOC : "DYPLOC: Dynamic Planning of Content Using Mixed Language Models for Text Generation". ACL(2021) [paper] [code]
- Tree-PLAN : "Infobox-to-text Generation with Tree-like Planning based Attention Network". IJCAI(2020) [paper]
- ProphetNet : "ProphetNet: Predicting Future N-gram for Sequence-to-Sequence Pre-training". EMNLP-Findings(2020) [paper] [code]
- PAIR : "PAIR: Planning and Iterative Refinement in Pre-trained Transformers for Long Text Generation". EMNLP(2020) [paper] [code]
- SentPlan : "Sentence-Level Content Planning and Style Specification for Neural Text Generation". EMNLP(2019) [paper] [code]
- PHVM : "Long and Diverse Text Generation with Planning-based Hierarchical Variational Model". EMNLP(2019) [paper] [code]
- TwinNet : "Twin Networks: Matching the Future for Sequence Generation". ICLR(2018) [paper] [code]
- PAG : "Plan, Attend, Generate: Planning for Sequence-to-Sequence Models". NIPS(2017) [paper]
? Back to Top
Decoding Algorithms
- Speculative Decoding : "Speculative Decoding: Exploiting Speculative Execution for Accelerating Seq2seq Generation". EMNLP-Findings(2023) [paper] [code]
- Medusa : "Medusa: Simple Framework for Accelerating LLM Generation with Multiple Decoding Heads". Github(2023) [Blog] [code]
- Lookahead Decoding : "Breaking the Sequential Dependency of LLM Inference Using Lookahead Decoding". LMSYS Org(2023) [Blog] [code]
- Speculative Sampling : "Accelerating Large Language Model Decoding with Speculative Sampling". arXiv(2023) [paper]
- Speculative Decoding : "Fast Inference from Transformers via Speculative Decoding". ICML(2023) [paper] [code]
- Parallel Decoding : "Accelerating Transformer Inference for Translation via Parallel Decoding". ACL(2023) [paper] [code]
- EAD : "The Stable Entropy Hypothesis and Entropy-Aware Decoding: An Analysis and Algorithm for Robust Natural Language Generation". arXiv(2023) [paper] [code]
- Contrastive Search : "Contrastive Search Is What You Need For Neural Text Generation". TMLR(2023) [paper] [code] [blog]
- Momentum Decoding : "Momentum Decoding: Open-ended Text Generation As Graph Exploration". arXiv(2022) [paper] [code]
- Crowd Sampling : "Follow the Wisdom of the Crowd: Effective Text Generation via Minimum Bayes Risk Decoding". arXiv(2022) [paper] [code]
- RankGen : "RankGen: Improving Text Generation with Large Ranking Models". EMNLP(2022) [paper] [code]
- Contrastive Decoding : "Contrastive Decoding: Open-ended Text Generation as Optimization". arXiv(2022) [paper] [code]
- COLD : "COLD Decoding: Energy-based Constrained Text Generation with Langevin Dynamics". NeurIPS(2022) [paper] [code]
- Lattice : "Massive-scale Decoding for Text Generation using Lattices". NAACL(2022) [paper] [code]
- KID : "Knowledge Infused Decoding". ICLR(2022) [paper] [code]
- NeuroLogic A*esque : "NeuroLogic A *esque Decoding: Constrained Text Generation with Lookahead Heuristics". NAACL(2022) [paper] [code]
- NeuroLogic : "NeuroLogic Decoding: (Un)supervised Neural Text Generation with Predicate Logic Constraints". NAACL(2021) [paper] [code]
- DeLorean : "Back to the Future: Unsupervised Backprop-based Decoding for Counterfactual and Abductive Commonsense Reasoning". EMNLP(2020) [paper] [code]
- Top-p (Nucleus) Sampling : "The Curious Case of Neural Text Degeneration". ICLR(2020) [paper] [code]
- BP Decoding : "Blockwise Parallel Decoding for Deep Autoregressive Models". NIPS(2018) [paper]
- Disjunctive Constraints : "Guided Generation of Cause and Effect". IJCAI(2020) [paper] [code-huggingface]
- CGMH : "CGMH: Constrained Sentence Generation by Metropolis-Hastings Sampling". AAAI(2019) [paper] [code]
- DBS : "Directed Beam Search: Plug-and-Play Lexically Constrained Language Generation". arXiv(2020) [paper] [code]
- DBA : "Fast Lexically Constrained Decoding with Dynamic Beam Allocation for Neural Machine Translation". NAACL(2018) [paper] [code-official] [code-fairseq]
- GBS : "Lexically Constrained Decoding for Sequence Generation Using Grid Beam Search". ACL(2017) [paper] [code]
? Back to Top
NLG Evaluation
- Survey : "Leveraging Large Language Models for NLG Evaluation: A Survey". arXiv(2024) [paper]
- BBScore : "BBScore: A Brownian Bridge Based Metric for Assessing Text Coherence". AAAI(2024) [paper]
- GPTEval : "GPTEval: NLG Evaluation using GPT-4 with Better Human Alignment". arXiv(2023) [paper]
- GPTScore : "GPTScore: Evaluate as You Desire". arXiv(2023) [paper] [code]
- RoMe : "RoMe: A Robust Metric for Evaluating Natural Language Generation". ACL(2022) [paper] [code]
- EAD : "Rethinking and Refining the Distinct Metric". ACL(2022) [paper] [code]
- MID : "Mutual Information Divergence: A Unified Metric for Multimodal Generative Models". NeurIPS(2022) [paper]
- DiscoScore : "DiscoScore: Evaluating Text Generation with BERT and Discourse Coherence". arXiv(2022) [paper] [code]
- CTC-Score : "Compression, Transduction, and Creation: A Unified Framework for Evaluating Natural Language Generation". EMNLP(2021) [paper] [code]
- BLEURT : "BLEURT: Learning Robust Metrics for Text Generation". ACL(2020) [paper] [code]
? Back to Top