ペーパーリーディングコンバイ
会話型AIの紙読みリスト、主に対話システムと自然言語生成を網羅しています。このリポジトリは常に更新されていますか? ...
- NLPの深い学習
- 対話システム
- 対話に関する調査
- 会話型LLM
- マルチモーダルダイアログ
- 積極的な対話
- その他。積極的な対話の
- ターゲット指向の対話
- 非共同対話(説得と交渉)
- パーソナライズされた対話
- キャラクターベースの対話
- 人格認識対話
- ペルソナベースの対話
- 感情的な対話
- 推奨ダイアログとCRS
- 知識に基づいた対話
- タスク指向の対話
- オープンドメインダイアログ
- 対話評価
- 対話のその他。
- 自然言語生成
- NLGに関する調査
- NLG理論とテクニック
- NLGの拡散モデル
- 制御可能な生成
- テキスト計画
- デコードアルゴリズム
- NLG評価
NLPの深い学習
- INLP :「インタラクティブな自然言語処理」。 arxiv(2023)[紙]
- データ増強:「NLPのデータ増強アプローチの調査」。 ACL-Findings(2021)[論文]
- プロンプト:「トレイン前、プロンプト、予測:自然言語処理におけるプロンプトの方法に関する体系的な調査」。 arxiv(2021)[論文]
- NLPワールドスコープ:「エクスペリエンスグラウンド言語」。 EMNLP(2020)[論文]
- Transformer-XL :「Transformer-XL:固定長のコンテキストを超えた丁寧な言語モデル」。 ACL(2019)[Paper] [Code]
- トランス:「注意が必要です」。 Neurips(2017)[Paper] [code-official] [code-tf] [code-py]
- VAE :「変分自動エンコーダーの紹介」。 arxiv(2019)[論文]
- 注意に関する調査:「NLP問題における注意メカニズムに関する入門調査」。 arxiv(2018)[論文]
- Additive注意:「整列と翻訳を共同で学習することによるニューラル機械翻訳」。 ICLR(2015)[論文]
- 乗法的な注意:「注意ベースのニューラル機械翻訳への効果的なアプローチ」。 EMNLP(2015)[論文]
- メモリネット:「エンドツーエンドメモリネットワーク」。 Neurips(2015)[論文]
- コピーメカニズム(PGN) :「ポイントに到達:ポインタージェネレーターネットワークでの要約」。 ACL(2017)[Paper] [Code]
- コピーメカニズム:「シーケンスからシーケンス学習にコピーメカニズムを組み込む」。 ACL(2016)[論文]
- エルモ:「深い文脈化された単語表現」。 NAACL(2018)[Paper] [Code]
- グローブ:「グローブ:単語表現のためのグローバルベクター」。 EMNLP(2014)[Paper] [Code]
- word2vecチュートリアル:「word2vecパラメーター学習説明」。 arxiv(2016)[論文]
- マルチタスク学習:「深いニューラルネットワークにおけるマルチタスク学習の概要」。 arxiv(2017)[論文]
- 勾配降下:「勾配降下最適化アルゴリズムの概要」。 arxiv(2016)[論文]
?トップに戻ります
対話システム
対話に関する調査
- データ生成:「会話データ生成の最近の進歩に関する調査」。 arxiv(2024)[紙]
- 積極的な対話:「積極的な対話システムに関する調査:問題、方法、見通し」。 Ijcai(2023)[論文]
- 責任ある対話:「最近の安全で責任ある、道徳的対話システムへの進歩:調査」。 arxiv(2023)[紙]
- 交渉対話:「交渉しましょう!交渉対話システムの調査」。 arxiv(2022)[紙]
- DLベースの対話:「ディープラーニングベースの対話システムの最近の進歩:体系的な調査」。 arxiv(2021)[論文]
- オープンドメインダイアログ:「インテリジェントオープンドメインダイアログシステムの構築における課題」。 TOIS(2020)[紙]
- 対話システム:「対話システムに関する調査:最近の進歩と新しいフロンティア」。 Sigkdd Explorations(2017)[Paper]
- Dialogue Corpora :「データ駆動型のダイアログシステムを構築するための利用可能なコーパスの調査」。 Arxiv(2017)[Paper] [データ]
?トップに戻ります
会話型LLM
- Parrot :「Parrot:質問を学ぶことでマルチターンチャットモデルの強化」。 arxiv(2023)[紙]
- Memochat :「Memochat:LLMSを調整して、一貫した長距離オープンドメイン会話にメモを使用します」。 arxiv(2023)[紙]
- Llama 2-chat :「Llama 2:Open Foundationと微調整されたチャットモデル」。メタ(2023)[紙] [コード]
- Chatglm3 :「Chatglm3シリーズ:バイリンガルチャットLLMSをオープン」。 Tsinghua(2023)[コード]
- chatglm2-6b :「chatglm2-6b:オープンバイリンガルチャットLLM」。 Tsinghua(2023)[コード]
- MPC :「LLMSを長いオープンドメインの会話のためのチャットボットモジュールとして促しました」。 ACL-Findings(2023)[Paper] [Code]
- MemoryBank-SiliconFriend :「MemoryBank:長期的なメモリで大きな言語モデルの強化」。 Arxiv(2023)[Paper] [code]
- Ultrachat :「高品質の教育的会話をスケーリングすることにより、チャット言語モデルの強化」。 arxiv(2023)[紙] [データ]
- Chatalpaca :「Chatalpaca:アルパカの指示に基づくマルチターンダイアログコーパス」。 Github(2023)[データ]
- フェニックス:「フェニックス:言語間でチャットグプトを民主化する」。 Arxiv(2023)[Paper] [code]
- ドリー:「フリードリー:世界初の真にオープンな命令チューニングLLMの紹介」。 DataBricks(2023)[コード]
- Baize :「Baize:自己チャットデータのパラメーター効率の高いチューニングを備えたオープンソースチャットモデル」。 Arxiv(2023)[Paper] [code]
- Vicuna :「Vicuna:90%のChatGPT品質でGPT-4を感動させるオープンソースのチャットボット」。 Lmsys org(2023)[blog] [code]
- コアラ:「コアラ:学術研究の対話モデル」。 UCバークレー(2023)[ブログ] [コード]
- ベル:「ベル:みんなの大規模な言語モデルエンジンになります」。 lianjiatech(2023)[コード]
- Alpaca :「Alpaca:強力で複製可能な命令に従うモデル」。スタンフォード(2023)[ブログ] [コード] [Alpaca-Lora]
- ChatGlm-6B :「オープンバイリンガルダイアログ言語モデル」。 Tsinghua(2023)[コード]
- オープンアシスタント:「オープンアシスタント:全員のための会話AI」。 Github(2023)[Project] [code]
- ChatGpt :「ChatGpt:ダイアログの言語モデルの最適化」。 Openai(2022)[ブログ]
- Sparrow :「ターゲットを絞った人間の判断を介した対話エージェントの調整の改善」。 arxiv(2022)[紙] [データ]
- BlenderBot3 :「BlenderBot 3:責任を持って関与することを継続的に学習する展開された会話エージェント」。 arxiv(2022)[紙]
- ラムダ:「ラムダ:ダイアログアプリケーションの言語モデル」。 arxiv(2022)[紙]
- Godel :「Godel:目標指向のダイアログの大規模な事前トレーニング」。 arxiv(2022)[Paper] [code]
- Anthropic Assistant-V2 :「人間のフィードバックからの補強学習で役立つ無害なアシスタントを訓練する」。 arxiv(2022)[紙]
- 人類のアシスタント:「調整のための研究室としての一般的な言語アシスタント」。 arxiv(2021)[論文]
?トップに戻ります
マルチモーダルダイアログ
位置と具体化された対話
- SLL :「第二言語学習のための大規模な言語モデルベースの状況対話」。 arxiv(2024)[紙]
- Emb-Plan :「合成具体化された対話で増強されたマルチモーダル具体化された計画予測」。 EMNLP(2023)[論文]
- WTAG :「ファンデーションモデルは、ケーキを作るために段階的に監視、話し、ガイドできますか?」 emnlp-findings(2023)[Paper] [code]
- SIMMC-VR :「SIMMC-VR:状況と没入型VRストリームを備えたタスク指向のマルチモーダルダイアログデータセット」。 ACL(2023)[論文]
- 確かに:「主観的な好みを備えたマルチモーダル推奨ダイアログ:新しい課題とベンチマーク」。 ACL(2023)[Paper] [データ]
- 砂糖:「位置づけられたプロアクティブな応答選択のためのテキストデータセット」。 ACL(2023)[Paper] [データ]
- MindDial :「MindDial:Situated Neulal Dialogue Generationのための理論モデリングを使用した信念ダイナミクス追跡」。 arxiv(2023)[紙]
- Holoassist :「Holoassist:現実世界のインタラクティブなAIアシスタント向けのエゴセントリックな人間の相互作用データセット」。 ICCV(2023)[Paper] [データ]
- コラボ:「状況に沿った対話でのマインドモデリングの理論による共同計画の獲得に向けて」。 ijcai(2023)[Paper] [code]
- Alexa Arena :「Alexa Arena:具体化されたAIのユーザー中心のインタラクティブプラットフォーム」。 Arxiv(2023)[Paper] [code]
- シーガル:「シーガル:状況に応じたダイアログをフォローする指示のための具体化されたエージェント」。 Alexa Prize Simbot Challenge(2023)[Paper]
- シットコム - デト:「あなたが言っているものはどれですか?状況に陥ったダイアログでのマルチモーダルオブジェクト識別」。 EACL-SRW(2023)[Paper] [Code]
- MLR :「ステップバイステップのマルチモーダルロジック推論を備えた状況の会話エージェントの改善」。 DSTC11(2023)[論文]
- SimpleMtod :「SimpleMtod:シンボリックシーンの表現とのマルチモーダルタスク指向の対話のためのシンプルな言語モデル」。 arxiv(2023)[紙]
- 春:「春:インクリメンタルレイアウトグラフからのマルチモーダルの質問で事前に処理された状況の会話エージェント」。 aaai(2023)[紙] [コード]
- ドロシー:「ドロシー:インタラクティブな自律運転剤の予期しない状況を処理するための話された対話」。 emnlp-findings(2022)[Paper] [code]
- ライトカリキュラム:「手続き的環境生成を通じて学習する対話の状況」。 ACL(2022)[論文]
- ダンリ:「ダンリ:自然言語の指示に従うための審議エージェント」。 EMNLP(2022)[Paper] [Code]
- PRS :「実用的なコミュニケーションに向けて格差を仲介することを学ぶ」。 ACL(2022)[Paper] [Code]
- 共同モデル:「状況に応じた会話エージェントのマルチモーダルコンテキストを埋め込むことを学ぶ」。 NAACL-FINDINGS(2022)[Paper] [Code]
- Teach_film :「具体化された対話における教師をコピーしないでください:データとモデルの課題」。 EMNLP(2022)[Paper] [Code]
- 教える:「教える:チャットするタスク駆動型の具体化されたエージェント」。 aaai(2022)[紙] [データ]
- MindCraft :「MindCraft:共同作業における状況に応じた対話のためのマインドモデリングの理論」。 EMNLP(2021)[Paper] [Code]
- Multimodal-Model :「SIMMC 2.0の前提条件モデルを使用したマルチモーダル相互作用」。 DSTC10(2022)[Paper] [Code]
- SIMMC 2.0 : "SIMMC 2.0:没入型マルチモーダル会話のためのタスク指向のダイアログデータセット" EMNLP(2021)[Paper] [Code]
- MM-DST :「状況に応じたマルチドメインエンドツーエンドダイアログシステムのマルチタスク学習」。 arxiv(2021)[論文]
- SIMMC :「状況とインタラクティブなマルチモーダル会話」。 Coling(2020)[Paper] [Code]
- Minecraft-Bap :「Minecraftの対話で指示を実行することを学ぶ」。 ACL(2020)[Paper] [Code]
- Crealbar :「状況に沿った共同相互作用で指示を実行する」。 EMNLP(2019)[Paper] [Code]
- Minecraft Dialogue :「Minecraftの共同対話」。 ACL(2019)[Paper] [Code]
- CLG :「地位のある人間のロボット対話に向けた共同言語の基礎」。 AIマガジン(2016)[論文]
- SHRD :「Back to the Blocks World:Ching lide new Actions feat Human-Robot Dialogue」。 Sigdial(2014)[Paper]
視覚的に接地された対話
- タイガー:「タイガー:マルチモーダルダイアログ応答生成のための統一された生成モデルフレームワーク」。コリング(2024)。 [紙] [コード]
- DialogCC :「DialogCC:高品質のマルチモーダルダイアログデータセットを作成するための自動パイプライン」。 NAACL(2024)[Paper] [データ]
- VLAW-MDM :「マルチモーダルダイアログモデルのビジョン言語ウォームアップタスクのフレームワーク」。 EMNLP(2023)[Paper] [Code]
- Zrigf :「Zrigf:Zero-Resourceの画像グラウンドのダイアログ生成のための革新的なマルチモーダルフレームワーク」。 ACM MM(2023)[Paper] [Code]
- vdialogue :「vdialogue:視覚的に接地された対話のための統一された評価ベンチマーク」。 arxiv(2023)[紙]
- TextBind :「TextBind:マルチターンインターリーブマルチモーダル命令が野生でフォローする」。 arxiv(2023)[紙] [データ]
- VSTAR :「VSTAR:シーンとトピックの移行を伴う状況に陥ったセマンティック理解のためのビデオ接地ダイアログデータセット」。 ACL(2023)[Paper] [データ]
- comset :「マルチモーダルペルソナベースのコミックダイアログの生成」。 ACL(2023)[Paper] [Code]
- MPCHAT :「MPCHAT:マルチモーダルのペルソナグラウンドの会話に向けて」。 ACL(2023)[Paper] [Code]
- ペース:「ペース:進歩的および作曲の専門家との事前トレーニング」の統一されたマルチモーダル対話」。 ACL(2023)[Paper] [Code]
- MMDialog :「MMDialog:マルチモーダルオープンドメイン会話に対する大規模なマルチターンダイアログデータセット」。 ACL(2023)[Paper] [データ]
- MDS-S2 :「マルチモーダルダイアログシステムを構成するデュアルセマンティック知識」。 Sigir(2023)[紙]
- Tiktalk :「Tiktalk:現実世界のChitchatのマルチモーダルダイアログデータセット」。 Arxiv(2023)[Paper] [code]
- シャンパン:「シャンパン:大規模なWebビデオから現実世界の会話を学ぶ」。 Arxiv(2023)[Paper] [code]
- MMCHAT :「MMCHAT:ソーシャルメディアのマルチモーダルチャットデータセット」。 LREC(2022)[Paper] [Code]
- CRVD :「ビデオに基づいたダイアログ生成のためのマルチモーダルセマンティックグラフの共同推論」。 emnlp-findings(2022)[論文]
- M3ED :「M3ED:マルチモーダルマルチシーンマルチラベル感情対話データベース」。 ACL(2022)[Paper] [データ]
- MDRG :「マルチモーダルダイアログ応答生成」。 ACL(2022)[論文]
- Unitranser :「Unitranser:マルチモーダルタスク指向のダイアログシステムの統一された変圧器セマンティック表現フレームワーク」。 ACL(2022)[論文]
- PhotoChat :「Photochat:共同画像テキストモデリングの写真共有動作を備えた人間の人間の対話データセット」。 ACL(2021)[Paper] [データ]
- マルチモーダルダイアログ:「マルチモーダルダイアログデータセットの構築テキストを意味的に関連する画像に置き換えて」。 ACL(2021)[Paper] [Code]
- OpenVidial 2.0 :「OpenVidial 2.0:視覚コンテキストを備えた大規模でオープンドメインダイアログ生成データセット」。 arxiv(2021)[紙] [データ]
- 宝物:「マルチモーダルダイアログシステム:リレーショナルグラフベースのコンテキスト対応の質問理解」。 ACM MM(2021)[Paper] [Code]
- MMCONV :「MMCONV:複数のドメインにわたるマルチモーダルの会話検索の環境」。 Sigir(2021)[Paper] [データ]
- 画像チャット:「画像チャット:魅力的な会話を魅了します」。 ACL(2020)[Paper] [データ]
- MTN :「エンドツーエンドのビデオ接地ダイアログシステム用のマルチモーダルトランスネットワーク」。 ACL(2019)[Paper] [Code]
- MELD :「MELD:会話における感情認識のためのマルチモーダルマルチパーティデータセット」。 ACL(2019)[Paper] [データ]
- CLEVR-DIALOG :「CLEVR-DIALOG:視覚的ダイアログでのマルチラウンド推論のための診断データセット」。 NAACL(2019)[Paper] [データ]
- visdial-RL :「多様な質問に答えることで生成的な視覚的ダイアログの改善」。 EMNLP(2019)[Paper] [Code]
- マジック:「マルチモーダルダイアログシステム:適応デコーダーを介して応答を生成」。 ACM MM(2019)[Paper] [Code]
- KMD :「知識を認識しているマルチモーダルダイアログシステム」。 ACM MM(2018)[論文]
- MMD :「大規模なマルチモーダルドメインアウェア会話システムの構築に向けて」。 aaai(2018)[Paper] [データ]
- 散歩を話す:「散歩を話す:根拠のある対話を通してニューヨーク市をナビゲートしてください」。 Arxiv(2018)[Paper] [Code]
- IGC :「画像グラウンドの会話:自然な質問と応答生成のためのマルチモーダルコンテキスト」。 IJCNLP(2017)[Paper] [データ]
- Visdial :「ビジュアルダイアログ」。 CVPR(2017)[Paper] [データ]
?トップに戻ります
積極的な対話
その他。積極的な対話の
- DPDP :「人間のような計画:対話計画のためのデュアルプロセスフレームワーク」。 ACL(2024)[Paper] [Code]
- PCA :「人間中心の積極的な会話エージェントに向けて」。 Sigir(2024)[紙]
- Procot :「積極的な対話のための大規模な言語モデルのプロンプトと評価:明確化、ターゲットガイド、および非コラボレーション」。 emnlp-findings(2023)[Paper] [code]
- チュートリアル:「会話型AIに対する目標の認識:積極性、非副虐待性、およびそれ以降」。 ACL(2023)[論文]
ターゲット指向の対話
- PAI :「オンライン教育における目標指向のインテリジェントな個別指導システムに向けて」。 arxiv(2023)[紙]
- TopDial :「パーソナライズを備えたターゲット指向のプロアクティブダイアログシステム:問題の定式化とデータセットキュレーション」。 EMNLP(2023)[Paper] [Code]
- RTCP :「ターゲット駆動型の会話プロモーションを補強」。 EMNLP(2023)[Paper] [Code]
- MTGP :「MTGP:柔軟なターンを備えた生成的なグローバルパスによって導かれたマルチターンターゲット指向のダイアログ」。 ACL-Findings(2023)[Paper] [Code]
- 色:「目標指向の積極的な対話のためのブラウンブリッジの確率的プロセスを介した対話計画」。 ACL-Findings(2023)[Paper] [Code]
- TOPKG :「TOPKG:知識グラフのグローバル計画によるターゲット指向のダイアログ」。 Coling(2022)[Paper] [Code]
- TGCP :「ターゲットガイド付きオープンドメイン会話計画」。 Coling(2022)[Paper] [Code]
- FOP :「対話のための長期的な制御:方法と評価」。 NAACL(2022)[Paper] [Code]
- CODA :「CommonsenseとDataの増強を使用したターゲットガイド付き対話応答生成」。 NAACL-FINDINGS(2022)[Paper] [Code]
- カワウソ:「カワウソ:オープンドメインダイアログのワンターントピック遷移」。 ACL(2021)[Paper] [データ]
- CG-NAR :「はっきりと考えて、速く話している:オープンドメインダイアログシステムのコンセプトガイド下の非自動性発電」。 EMNLP(2021)[Paper] [Code]
- Duconv :「明示的な会話の目標を備えた積極的な人間の会話」。 ACL(2019)[Paper] [Code]
- CKC :「キーワードガイド付きニューラル会話モデル」。 aaai(2021)[紙] [コード]
- Knowhrl :「知識グラフオープンドメインの会話生成のための目標計画」。 aaai(2020)[紙]
- DKRN :「ターゲット誘導オープンドメイン会話のための動的知識ルーティングネットワーク」。 aaai(2020)[紙] [コード]
- TGCONV :「ターゲットガイド付きオープンドメイン会話」。 ACL(2019)[Paper] [Code]
非共同対話(説得と交渉)
- 旅行:「強さは違いにあります!カスタマイズされた戦略計画を介した効果的な非協力的な対話に向けて」。 arxiv(2024)[紙]
- INA :「INA:報酬ベースの対話システムを使用して交渉戦略を強化するための統合的アプローチ」。 EMNLP(2023)[Paper] [データ]
- I-Pro :「非協力的なユーザーとの対話:積極的な対話ポリシーの新しいパラダイム」。 Sigir(2022)[紙]
- Paad :「進行を認識している自律的な対話エージェントに向けて」。 NAACL(2022)[Paper] [Code]
- Persrfi :「洗練と模倣:強化学習と人間のデモンストレーションによる説得の対話における繰り返しと矛盾を減らす」。 emnlp-findings(2021)[Paper] [code]
- Resper :「Resper:説得力のある会話における抵抗戦略の計算モデリング」。 EACL(2021)[Paper] [Code]
- ARDM :「大規模な事前訓練モデルを使用した再発ダイアログモデルを交互に」。 EACL(2021)[Paper] [Code]
- ダイアラグラフ:「ダイアルグラフ:解釈可能な戦略グラフネットワークを交渉対話に組み込む」。 ICLR(2021)[Paper] [Code]
- NegotiationTom :「パーソナリティモデリングとの交渉のためのダイアログシステムの改善」。 ACL(2021)[Paper] [Code]
- Fehed :「明示的なセマンティックおよび戦略的ダイアログの履歴を備えた非共同ダイアログシステムの増強」。 ICLR(2020)[Paper] [Code]
- CTX-PSA :「自由回答形式のダイアログシステムのために別々に計画し、実現することを学ぶ」。 emnlp-findings(2020)[Paper] [code]
- 交渉コーチ:「効果的な交渉のためのダイナミックな戦略コーチ」。 Sigdial(2019)[Paper] [Code]
- 説得力のあるもの:「善のための説得:社会的利益のための個別の説得力のある対話システムに向けて」。 ACL(2019)[Paper] [データ]
- Craigslistbargain :「交渉の対話における戦略と生成の分離」。 EMNLP(2018)[Paper] [データ]
?トップに戻ります
パーソナライズされた対話
キャラクターベースの対話
- LLM-Werewolf :「コミュニケーションゲームのための大規模な言語モデルの探索:狼に関する実証研究」。 arxiv(2023)[紙]
- Chatharuhi :「Chatharuhi:大規模な言語モデルを介して現実にアニメキャラクターを復活させる」。 arxiv(2023)[レポート] [コード]
- DPCD :「こんにちはシェルドン!テレビ番組から深いパーソナライズされたキャラクターを作成します」。 arxiv(2023)[紙] [データ]
- Cornell Rich :「リッチメタデータアノテーションを使用したスクリーン文字のパーソナライズされた言語モデリング」。 arxiv(2023)[紙] [データ]
- ナッジ:「プレイヤー以外のキャラクターの対話の存在論的に忠実な世代」。 Arxic(2022)[論文]
- HPD :「大規模な言語モデルはハリー・ポッターに会います:ダイアログエージェントをキャラクターに合わせるためのバイリンガルデータセット」。 arxiv(2022)[紙] [データ]
- Dialstory :「ストーリーのキャラクター間の対話を理解し、生成するためのベンチマーク」。 arxiv(2022)[紙]
- CareCall :「大規模な言語モデルを活用するオープンドメインダイアログシステムを指定した役割の構築」。 NAACL(2022)[Paper] [データ]
- PDP :「お気に入りのキャラクターに会いましょう:オープンドメインチャットボットは、ほんの少しの発言で架空のキャラクターを模倣しています」。 NAACL(2022)[Paper] [Code]
- RPA :「私またはあなたは?最先端のダイアログモデルはアイデンティティを維持できません」。 Naacl-findings(2022)[紙]
- CharacterChat :「CharacterChat:会話を通して架空のキャラクターの作成をサポートし、チャットボットを使用したプログレッシブマニフェスト」。 ACM C&C(2021年)[紙]
- アロハ:「アロハ:対話エージェントのための人間の属性の人工学習」。 aaai(2020)[紙] [コード]
- 光:「ファンタジーテキストアドベンチャーゲームで話し、行動することを学ぶ」。 EMNLP(2019)[Paper] [データ]
人格認識対話
- UBPL :「監視なしに構築されたパーソナライズされたレキシコンを介して、大規模な言語モデルで性格特性を調整する」。 arxiv(2023)[紙]
- CharacterChat :「CharacterChat:パーソナライズされたソーシャルサポートで会話型AIに向けて学ぶ」。 Arxiv(2023)[Paper] [code]
- ChatGpt-MBTI :「ChatGptは人間の性格を評価できますか?一般的な評価フレームワーク」。 Arxiv(2023)[Paper] [code]
- プロンプトの性格:「ゼロショットの迅速ベースの学習との対話で性格スタイルを制御する」。 IWSDS(2023)[論文]
- CPED :「CPED:会話AIのための大規模な中国のパーソナライズされた感情的な対話データセット」。 arxiv(2022)[紙] [データ]
- Peld :「人格に影響を受けた感情の遷移を介して、応答の感情を自動的に選択します」。 ACL-Findings(2021)[Paper] [データ]
- FriendsPersona :「気配りのあるネットワークとコンテキスト埋め込みを使用した、独白とマルチパーティの対話に関する自動テキストベースの性格認識」。 aaai-student abstract(2020)[Paper] [データ]
- APR :「マルチパーティダイアログでオーバーラップダイナミクスを使用して性格特性を識別する」。 Speech(2019)[論文]
- PersonalDilaog :「多様な特性を備えたパーソナライズされた対話の生成」。 Arxiv(2019)[Paper] [データ]
- PersonAgenlg :「神経自然言語ジェネレーターを使用した人格ベースのスタイルバリエーションを制御する」。 Sigdial(2018)[Paper] [データ]
ペルソナベースの対話
- Comperdial :「Comperdial:Commonsense Persona-Grounded Dialogue Dataset and Benchmark」。 arxiv(2024)[紙]
- IDL : "" Dialogues we Learn ":Dialogue In Learningを通じて事前に定義されたプロファイルなしのパーソナライズされた対話に向けて」。 arxiv(2024)[紙]
- Dialogicl :「適切なプロンプトを作成するか、模範的な対話を提供しますか?ペルソナベースの対話生成のためのコンテキスト学習の研究」。 arxiv(2024)[紙]
- VARMI :「オフライン強化学習を備えたペルソナの一貫したダイアログエージェントの構築」。 EMNLP(2023)[Paper] [Code]
- Opela :「群衆がペルソナに出会うとき:大規模なオープンドメインペルソナダイアログコーパスを作成します」。 arxiv(2023)[紙] [データ]
- Orig :「注文と感受性の表現の正則化による堅牢なパーソナライズされた対話生成に向けて」。 ACL-Findings(2023)[Paper] [Code]
- CLV :「対照的な潜在変数を備えたパーソナライズされた対話生成の強化:まばらで密なペルソナの組み合わせ」。 ACL(2023)[Paper] [Code]
- Simoap :「Simoap:過剰なサンプリングと評価後のペルソナベースの対話生成の一貫性と一貫性を改善」。 ACL(2023)[Paper] [Code]
- LMEDR :「ペルソナ一貫性のある対話のための伴う関係と談話関係を記憶することを学ぶ」。 aaai(2023)[紙] [コード]
- 検索から予測へ:「ペルソナ拡張による会話の性格の一貫性の向上」。 Cikm(2022)[Paper] [Code]
- Implicit-Persona :「暗黙のユーザーペルソナ検出を備えたパーソナライズされたダイアログジェネレーター」。 Coling(2022)[論文]
- CareCallMemory :「私を更新してください!長期的な会話でメモリ管理」。 emnlp-findings(2022)[Paper] [data]
- PersonAdefense :「あなたは私の好きな色を知らない:話者の個人的なペルソナを明らかにするのを防ぐのを防ぐ」。 NAACL(2022)[Paper] [Code]
- プロンプトチューニング:「プロンプトチューニングを備えたパーソナライズされたダイアログシステムの構築」。 naacl-srw(2022)[論文]
- Dulemon :「長い間見ない!長期的なペルソナ記憶とのオープンドメインの会話」。 ACL-Findings(2022)[Paper] [データ]
- 情報:「あなたは私が必要とするものを本当に理解しています:知的で友好的な対話エージェントの基礎知識とペルソナ」。 emnlp-findings(2022)[Paper] [code]
- フォーカス:「カスタマイズされた会話の呼びかけ:カスタマイズされた会話の接地ペルソナと知識」。 aaai(2022)[紙] [コード]
- MSP :「より少ない:パーソナライズされた対話生成のための対話履歴を洗練することを学ぶ」。 NAACL(2022)[論文]
- GME :「接地された最小編集を介した編入可能なペルソナグラウンドの対話」。 EMNLP(2021)[Paper] [Code]
- ボブ:「ボブ:限られたパーソナライズされたデータからペルソナベースの対話モデルをトレーニングするために、バートオーバーバート」。 ACL(2021)[Paper] [Code]
- Pabst :「監視されていないペルソナグラウンドのダイアログと背景ストーリーの濃縮」。 ACL(2021)[Paper] [Code]
- DHAP :「1人あたり1つのチャットボット:暗黙のユーザープロファイルに基づいてパーソナライズされたチャットボットの作成」。シギル(2021)[紙]
- PCHATBOT :「PCHATBOT:パーソナライズされたチャットボット用の大規模なデータセット」。 Sigir(2021)[Paper] [データ]
- COMPAC :「ハイキングのようなものですか?おそらく自然を楽しんでいます:常識的な拡張を備えたペルソナグラウンドのダイアログ」。 EMNLP(2020)[Paper] [Code]
- 実用的な整合性:「私は私のように聞こえますか?実用的な自己意識による対話のペルソナの一貫性を改善します」。 EMNLP(2020)[Paper] [Code]
- XPersona :「XPersona:多言語のパーソナライズされたチャットボットの評価」。 arxiv(2020)[紙] [データ]
- KVPI :「オープンドメインダイアログエージェントのプロファイルの一貫性識別」。 EMNLP(2020)[Paper] [Code]
- GDR :「生成、削除、書き換え:対話生成のペルソナの一貫性を改善するための3段階のフレームワーク」。 ACL(2020)[論文]
- P^2bot :「あなたは私を感動させます:相互のペルソナ認識による対話生成」。 ACL(2020)[Paper] [Code]
- RCDG :「自然言語の推論を活用することにより、ペルソナの一貫した対話を生成する」。 aaai(2020)[紙] [コード]
- ペルソナスパルス:「ペルソナスパルスデータを使用したトレーニング前ベースのパーソナライズされたダイアログ生成モデル」。 aaai(2020)[紙]
- Personawae :「拡張されたWasserstein Autoencodersを介した応答生成のための連続空間でのパーソナライズのモデリング」。 EMNLP(2019)[論文]
- PAML :「メタラーニングによる対話エージェントのパーソナライズ」。 ACL(2019)[Paper] [Code]
- Personachat :「ダイアログエージェントのパーソナライズ:私には犬がいます、ペットもいますか?」 ACL(2018)[Paper] [データ]
- PCCM :「コヒーレントな会話生成のために、チャットマシンに性格/プロフィールを割り当てる」。 ijcai(2018)[論文]
?トップに戻ります
感情的な対話
感情的なサポート対話
- 優先バイアス:「大規模な言語モデルは、感情的なサポーターを緩和することができますか?感情的なサポートの会話に対する好みのバイアスを緩和します」。 ACL(2024)[論文]
- エスコット:「エスコット:解釈可能な感情的サポート対話システムに向けて」。 ACL(2024)[Paper] [Code]
- マフィン:「マフィン:多面的なAIフィードバックとの感情的なサポートの会話における無益さを軽減する」。 ACL-Findings(2024)[Paper] [Code]
- DDRCU :「感情的なサポートの会話のためのダイナミックデモンストレーションの検索と認知的理解」。 Sigir(2024)[Paper] [Code]
- Kemi :「感情的なサポートの会話のための知識強化された混合開始対話システム」。 ACL(2023)[Paper] [Code]
- CSCONV :「認知障害のある高齢者向けのマルチソースナレッジフュージョンを備えた認知刺激対話システム」。 ACL(2023)[Paper] [Code]
- Ocesc :「Ocousc:感情的なサポートの会話のための大規模な言語モデルを使用した対話の増強」。 ACL-Findings(2023)[論文]
- TransESC :「TransESC:ターンレベルの状態移行による感情的サポートの会話を滑らかにする」。 ACL-Findings(2023)[Paper] [Code]
- PAL :「PAL:Persona-Augmented Emotional Support Conversation Generation」。 ACL-Findings(2023)[Paper] [Code]
- Multisc :「Lookahead戦略計画によるマルチターン感情的サポートの対話の改善」。 EMNLP(2022)[Paper] [Code]
- MISC :「MISC:感情的なサポートの会話のための彗星を統合する混合戦略を意識したモデル」。 ACL(2022)[Paper] [Code]
- C3KG :「C3KG:中国の常識的な会話知識グラフ」。 ACL-Findings(2022)[Paper] [データ]
- GLHG :「グローバルに制御し、ローカルで理解する:感情的なサポートの会話のためのグローバルからローカルな階層グラフネットワーク」。 ijcai(2022)[論文]
- ESCONV :「感情的なサポートダイアログシステムに向けて」。 ACL(2021)[Paper] [データ]
共感的な対話
- Stickerconv :「Stickerconv:ゼロからマルチモーダル共感的応答を生成する」。 ACL(2024)[Paper] [データ]
- Perceptiveagent :「人間のようなエージェントと話す:知覚可能な音響受信と反応による共感的な対話」。 ACL(2024)[Paper] [Code]
- e-core : "e-core:感情相関強化共感的対話生成" emnlp(2023)[Paper]
- Empsoa :「自分を失ってはいけません!明示的な自己認識を介して共感的な応答生成」。 ACL-Findings(2023)[Paper] [Code]
- ケース:「ケース:共感的な反応の生成に対する粗い認識と愛情を調整する」。 ACL(2023)[Paper] [Code]
- ケア:「ケア:条件付きグラフ生成による共感的応答の因果関係の推論」。 emnlp-findings(2022)[Paper] [code]
- EMPGPT-3 :「GPT-3は共感的な対話を生成しますか?共感的な対話の生成のための新しいコンテキストの例の選択方法と自動評価メトリック」。 Coling(2022)[Paper] [Code]
- PoseModial :「肯定的な感情の誘発を伴う多ターン共感的対話に向けて」。 arxiv(2022)[紙]
- CEM :「CEM:Commonsense-Ware Aware共感的反応生成」。 aaai(2022)[紙] [コード]
- Gee :「感情の原因に焦点を当てた共感的な反応を生成するための視点を獲得し、プラグマティクス」。 EMNLP(2021)[Paper] [Code]
- Recec :「会話の感情原因を認識することにより、共感的な反応の生成を改善する」。 emnlp-findings(2021)[Paper] [code]
- Comae :「Comae:共感的反応生成のための多要因階層的なフレームワーク」。 ACL-Findings(2021)[Paper] [Code]
- ケア:「ケア:潜在的な概念を備えた常識に気づいた感情的反応生成」。 aaai(2021)[紙] [コード]
- EMPDG :「EMPDG:マルチ解像度インタラクティブな共感的対話の生成」。 Coling(2020)[Paper] [Code]
- Mime :「Mime:共感的な反応生成のために感情を模倣する」。 EMNLP(2020)[Paper] [Code]
- PEC :「ペルソナベースの共感的な会話モデルに向けて」。 EMNLP(2020)[Paper] [Code]
- Moel :「Moel:共感的なリスナーの混合」。 EMNLP(2019)[Paper] [Code]
- empatheticdialogues :「共感的なオープンドメイン会話モデルに向けて:新しいベンチマークとデータセット」。 ACL(2019)[Paper] [データ]
- EMODS :「ダイアログで特定の感情を備えた応答を生成する」。 ACL(2019)[論文]
- Mojitalk :「Mojitalk:大規模な感情的な反応を生み出す」。 ACL(2018)[論文]
- ECM :「感情的なチャットマシン:内部および外部のメモリとの感情的な会話の生成」。 aaai(2018)[Paper] [code]
?トップに戻ります
推奨ダイアログとCRS
- TCP-Dial :「フォローミー:ターゲット主導型の推奨ダイアログシステムの会話計画」。 arxiv(2022)[Paper] [code]
- Kers :「Kers:複数のサブゴールを備えた推奨ダイアログシステムのための知識強化フレームワーク」。 emnlp-findings(2021)[Paper] [code]
- Durecdial2.0 :「Durecdial 2.0:会話勧告のためのバイリンガル平行コーパス」。 EMNLP(2021)[Paper] [Code]
- Durecdial :「マルチタイプのダイアログに関する会話の推奨に向けて」。 ACL(2020)[Paper] [Code]
- TG-Redial :「トピックガイド付きの会話推奨システムに向けて」。 Coling(2020)[Paper] [Code]
- インスピレーション:「インスピレーション:社交的な推奨ダイアログシステムに向けて」。 EMNLP(2020)[Paper] [データ]
- Gorecdial :「コミュニケーションゲームとしての推奨事項:目標指向の対話のための自己監視ボットプレイ」。 EMNLP(2019)[Paper] [Code]
- CRS-Survey :「会話型推奨システムに関する調査」。 ACMコンピューティング調査(2021)[論文]
- CRS-Survey :「会話の推奨システムの進歩と課題:調査」。 arxiv(2021)[論文]
- CRSLAB :「CRSLAB:会話型推奨システムを構築するためのオープンソースツールキット」。 arxiv(2021)[Paper] [code]
- MESE :「コンテキスト認識アイテムメタ情報を使用して、会話型推奨システムの品質を改善する」。 NAACL(2022)[Paper] [Code]
- C2-CRS :「C2-CRS:会話型推奨システムの粗から洗練された対照学習」。 WSDM(2022)[Paper] [Code]
- BotPlay : "Self-Supervised Bot Play for Conversational Recommendation with Justifications". arXiv(2021) [paper]
- RID : "Finetuning Large-Scale Pre-trained Language Models for Conversational Recommendation with Knowledge Graph". arXiv(2021) [paper] [code]
- CRFR : "CRFR: Improving Conversational Recommender Systems via Flexible Fragments Reasoning on Knowledge Graphs". EMNLP(2021) [paper]
- NTRD : "Learning Neural Templates for Recommender Dialogue System". EMNLP(2021) [paper] [code]
- CR-Walker : "CR-Walker: Tree-Structured Graph Reasoning and Dialog Acts for Conversational Recommendation". EMNLP(2021) [paper] [code]
- RevCore : "RevCore: Review-augmented Conversational Recommendation". ACL-Findings(2021) [paper] [code]
- KECRS : "KECRS: Towards Knowledge-Enriched Conversational Recommendation System". arXiv(2021) [paper]
- FPAN : "Adapting User Preference to Online Feedback in Multi-round Conversational Recommendation". WSDM(2021) [paper] [code]
- UNICORN : "Unified Conversational Recommendation Policy Learning via Graph-based Reinforcement Learning". SIGIR(2021) [paper] [code]
- KGSF : "Improving Conversational Recommender Systems via Knowledge Graph based Semantic Fusion". KDD(2020) [paper] [code]
- CPR : "Interactive Path Reasoning on Graph for Conversational Recommendation". KDD(2020) [paper] [code]
- EAR : "Estimation-Action-Reflection: Towards Deep Interaction Between Conversational and Recommender Systems". WSDM(2020) [paper] [code]
- KBRD : "Towards Knowledge-Based Recommender Dialog System". EMNLP(2019) [paper] [code]
- ReDial : "Towards Deep Conversational Recommendations". NeurIPS(2018) [paper] [data]
?トップに戻ります
Knowledge-grounded Dialogue
- DOCTOR : "Dialogue Chain-of-Thought Distillation for Commonsense-aware Conversational Agents". EMNLP(2023) [paper] [code] [demo]
- GATE : "Well Begun is Half Done: Generator-agnostic Knowledge Pre-Selection for Knowledge-Grounded Dialogue". EMNLP(2023) [paper] [code]
- CONNER : "Beyond Factuality: A Comprehensive Evaluation of Large Language Models as Knowledge Generators". EMNLP(2023) [paper] [code]
- K-DIAL : "Improving Factual Consistency for Knowledge-Grounded Dialogue Systems via Knowledge Enhancement and Alignment". EMNLP-Findings(2023) [paper]
- GLM-Dialog : "GLM-Dialog: Noise-tolerant Pre-training for Knowledge-grounded Dialogue Generation". arXiv(2023) [paper] [code]
- RHO : "RHO (ρ): Reducing Hallucination in Open-domain Dialogues with Knowledge Grounding". ACL-Findings(2023) [paper] [code]
- MultiRefKGC : "There Is No Standard Answer: Knowledge-Grounded Dialogue Generation with Adversarial Activated Multi-Reference Learning". EMNLP(2022) [paper] [code]
- CorefDiffs : "CorefDiffs: Co-referential and Differential Knowledge Flow in Document Grounded Conversations". COLING(2022) [paper] [code]
- DTR : "Stylized Knowledge-Grounded Dialogue Generation via Disentangled Template Rewriting". NAACL(2022) [paper] [code]
- XDAI : "XDAI: A Tuning-free Framework for Exploiting Pre-trained Language Models in Knowledge Grounded Dialogue Generation". KDD(2022) [paper] [code]
- PersonaKGC : "There Are a Thousand Hamlets in a Thousand People's Eyes: Enhancing Knowledge-grounded Dialogue with Personal Memory". ACL(2022) [paper] [code]
- KI : "Lexical Knowledge Internalization for Neural Dialog Generation". ACL(2022) [paper] [code]
- DiffKG : "Towards Large-Scale Interpretable Knowledge Graph Reasoning for Dialogue Systems". ACL-Findings(2022) [paper] [code]
- KSAM : "KSAM: Infusing Multi-Source Knowledge into Dialogue Generation via Knowledge Source Aware Multi-Head Decoding". ACL-Findings(2022) [paper]
- MDSP : "Multi-Stage Prompting for Knowledgeable Dialogue Generation". ACL-Findings(2022) [paper] [code]
- FSB : "Few-Shot Bot: Prompt-Based Learning for Dialogue Systems". arXiv(2021) [paper] [code]
- P-GDG : "Exploring Prompt-based Few-shot Learning for Grounded Dialog Generation". arXiv(2021) [paper]
- KAT-TSLF : "A Three-Stage Learning Framework for Low-Resource Knowledge-Grounded Dialogue Generation". EMNLP(2021) [paper] [code]
- DIALKI : "DIALKI: Knowledge Identification in Conversational Systems through Dialogue-Document Contextualization". EMNLP(2021) [paper] [code]
- CoLV : "CoLV: A Collaborative Latent Variable Model for Knowledge-Grounded Dialogue Generation". EMNLP(2021) [paper]
- SKT-KG : "Augmenting Knowledge-grounded Conversations with Sequential Knowledge Transition". NAACL(2021) [paper]
- MSKE : "More is Better: Enhancing Open-Domain Dialogue Generation via Multi-Source Heterogeneous Knowledge". EMNLP(2021) [paper] [code]
- EARL : "EARL: Informative Knowledge-Grounded Conversation Generation with Entity-Agnostic Representation Learning". EMNLP(2021) [paper] [code]
- KGD-CF : "Increasing Faithfulness in Knowledge-Grounded Dialogue with Controllable Features". ACL(2021) [paper]
- SECE : "Space Efficient Context Encoding for Non-Task-Oriented Dialogue Generation with Graph Attention Transformer". ACL(2021) [paper] [code]
- MIKe : "Initiative-Aware Self-Supervised Learning for Knowledge-Grounded Conversations". SIGIR(2021) [paper] [code]
- GOKC : "Learning to Copy Coherent Knowledge for Response Generation". AAAI(2021) [paper] [code]
- KnowledGPT : "Knowledge-Grounded Dialogue Generation with Pre-trained Language Models". EMNLP(2020) [paper] [code]
- DiffKS : "Difference-aware Knowledge Selection for Knowledge-grounded Conversation Generation". EMNLP-Findings(2020) [paper] [code]
- DukeNet : "DukeNet: A Dual Knowledge Interaction Network for Knowledge-Grounded Conversation". SIGIR(2020) [paper] [code]
- CCN : "Cross Copy Network for Dialogue Generation". EMNLP(2020) [paper] [code]
- PIPM : "Bridging the Gap between Prior and Posterior Knowledge Selection for Knowledge-Grounded Dialogue Generation". EMNLP(2020) [paper]
- ConceptFlow : "Grounded Conversation Generation as Guided Traverses in Commonsense Knowledge Graphs". ACL(2020) [paper] [code]
- ConKADI : "Diverse and Informative Dialogue Generation with Context-Specific Commonsense Knowledge Awareness". ACL(2020) [paper] [code]
- KIC : "Generating Informative Conversational Response using Recurrent Knowledge-Interaction and Knowledge-Copy". ACL(2020) [paper]
- SKT : "Sequential Latent Knowledge Selection for Knowledge-Grounded Dialogue". ICLR(2020) [paper] [code]
- KdConv : "KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn Knowledge-driven Conversation". ACL(2020) [paper] [data]
- TransDG : "Improving Knowledge-aware Dialogue Generation via Knowledge Base Question Answering". AAAI(2020) [paper] [code]
- RefNet : "RefNet: A Reference-aware Network for Background Based Conversation". AAAI(2020) [paper] [code]
- GLKS : "Thinking Globally, Acting Locally: Distantly Supervised Global-to-Local Knowledge Selection for Background Based Conversation". AAAI(2020) [paper] [code]
- AKGCM : "Knowledge Aware Conversation Generation with Explainable Reasoning over Augmented Graphs". EMNLP(2019) [paper] [code]
- DyKgChat : "DyKgChat: Benchmarking Dialogue Generation Grounding on Dynamic Knowledge Graphs". EMNLP(2019) [paper] [code]
- OpenDialKG : "OpenDialKG: Explainable Conversational Reasoning with Attention-based Walks over Knowledge Graphs". ACL(2019) [paper] [data]
- WoW : "Wizard of Wikipedia: Knowledge-Powered Conversational agents". ICLR(2019) [paper]
- PostKS : "Learning to Select Knowledge for Response Generation in Dialog Systems". IJCAI(2019) [paper] [code-1] [code-2]
- NKD : "Knowledge Diffusion for Neural Dialogue Generation". ACL(2018) [paper] [data]
- Dual Fusion : "Smarter Response with Proactive Suggestion: A New Generative Neural Conversation Paradigm". IJCAI(2018) [paper]
- CCM : "Commonsense Knowledge Aware Conversation Generation with Graph Attention". IJCAI(2018) [paper] [code-tf] [code-py]
- MTask : "A Knowledge-Grounded Neural Conversation Model". AAAI(2018) [paper]
- GenDS : "Flexible End-to-End Dialogue System for Knowledge Grounded Conversation". arXiv(2017) [paper]
?トップに戻ります
Task-oriented Dialogue
- P-ToD : "Personalizing Task-oriented Dialog Systems via Zero-shot Generalizable Reward Function". CIKM(2022) [paper]
- Dialogic : "Dialogic: Controllable Dialogue Simulation with In-Context Learning". EMNLP-Findings(2022) [paper] [code]
- KB-Adapter : "Injecting Domain Knowledge in Language Models for Task-Oriented Dialogue Systems". EMNLP(2022) [paper] [code]
- TacoBot : "Bootstrapping a User-Centered Task-Oriented Dialogue System". Proceedings of Alexa Prize TaskBot(2021) [paper]
- USDA : "User Satisfaction Estimation with Sequential Dialogue Act Modeling in Goal-oriented Conversational Systems". WWW(2022) [paper] [code]
- USS : "Simulating User Satisfaction for the Evaluation of Task-oriented Dialogue Systems". SIGIR(2021) [paper] [data]
- NS-Dial : "An Interpretable Neuro-Symbolic Reasoning Framework for Task-Oriented Dialogue Generation". ACL(2022) [paper] [code]
- GALAXY : "GALAXY: A Generative Pre-trained Model for Task-Oriented Dialog with Semi-Supervised Learning and Explicit Policy Injection". AAAI(2022) [paper] [code]
- PPTOD : "Multi-Task Pre-Training for Plug-and-Play Task-Oriented Dialogue System". arXiv(2021) [paper] [code]
- ToDCL : "Continual Learning in Task-Oriented Dialogue Systems". EMNLP(2021) [paper] [code]
- IR-Net : "Intention Reasoning Network for Multi-Domain End-to-end Task-Oriented Dialogue". EMNLP(2021) [paper]
- HyKnow : "HyKnow: End-to-End Task-Oriented Dialog Modeling with Hybrid Knowledge Management". ACL-Findings(2021) [paper] [code]
- DDMN : "Dual Dynamic Memory Network for End-to-End Multi-turn Task-oriented Dialog Systems". COLING(2020) [paper] [code]
- ToD-BERT : "ToD-BERT: Pre-trained Natural Language Understanding for Task-Oriented Dialogues". EMNLP(2020) [paper] [code]
- GraphDialog : "GraphDialog: Integrating Graph Knowledge into End-to-End Task-Oriented Dialogue Systems". EMNLP(2020) [paper] [code]
- MARCO : "Multi-Domain Dialogue Acts and Response Co-Generation". ACL(2020) [paper] [code]
- DF-Net : "Dynamic Fusion Network for Multi-Domain End-to-end Task-Oriented Dialog". ACL(2020) [paper] [code]
- MALA : "MALA: Cross-Domain Dialogue Generation with Action Learning". AAAI(2020) [paper]
- SGD : "Towards Scalable Multi-domain Conversational Agents: The Schema-Guided Dialogue Dataset". AAAI(2020) [paper] [data]
- CrossWOZ : "CrossWOZ: A Large-Scale Chinese Cross-Domain Task-Oriented Dialogue Dataset". TACL(2020) [paper] [code]
- MultiWOZ : "MultiWOZ - A Large-Scale Multi-Domain Wizard-of-Oz Dataset for Task-Oriented Dialogue Modelling". EMNLP(2018) [paper] [code]
- Neural Task-Oriented Dialogue : "Learning to Memorize in Neural Task-Oriented Dialogue Systems". MPhil Thesis(2019) [paper]
- GLMP : "Global-to-local Memory Pointer Networks for Task-Oriented Dialogue". ICLR(2019) [paper] [code]
- KB Retriever : "Entity-Consistent End-to-end Task-Oriented Dialogue System with KB Retriever". EMNLP(2019) [paper] [data]
- TRADE : "Transferable Multi-Domain State Generator for Task-Oriented Dialogue Systems". ACL(2019) [paper] [code]
- WMM2Seq : "A Working Memory Model for Task-oriented Dialog Response Generation". ACL(2019) [paper]
- Pretrain-Fine-tune : "Training Neural Response Selection for Task-Oriented Dialogue Systems". ACL(2019) [paper] [data]
- Multi-level Mem : "Multi-Level Memory for Task Oriented Dialogs". NAACL(2019) [paper] [code]
- BossNet : "Disentangling Language and Knowledge in Task-Oriented Dialogs ". NAACL(2019) [paper] [code]
- SDN : "Subgoal Discovery for Hierarchical Dialogue Policy Learning". EMNLP(2018) [paper]
- D3Q : "Discriminative Deep Dyna-Q: Robust Planning for Dialogue Policy Learning". EMNLP(2018) [paper] [code]
- DDQ : "Deep Dyna-Q: Integrating Planning for Task-Completion Dialogue Policy Learning". ACL(2018) [paper] [code]
- MAD : "Memory-augmented Dialogue Management for Task-oriented Dialogue Systems". TOIS(2018) [paper]
- TSCP : "Sequicity: Simplifying Task-oriented Dialogue Systems with Single Sequence-to-Sequence Architectures". ACL(2018) [paper] [code]
- Mem2Seq : "Mem2Seq: Effectively Incorporating Knowledge Bases into End-to-End Task-Oriented Dialog Systems". ACL(2018) [paper] [code]
- Topic-Seg-Label : "A Weakly Supervised Method for Topic Segmentation and Labeling in Goal-oriented Dialogues via Reinforcement Learning". IJCAI(2018) [paper] [code]
- AliMe : "AliMe Chat: A Sequence to Sequence and Rerank based Chatbot Engine". ACL(2017) [paper]
- KVR Net : "Key-Value Retrieval Networks for Task-Oriented Dialogue". SIGDIAL(2017) [paper] [data]
?トップに戻ります
Open-domain Dialogue
Long-term Dialogue
- THEANINE : "THEANINE: Revisiting Memory Management in Long-term Conversations with Timeline-augmented Response Generation". arXiv(2024) [paper]
- LD-Agent : "Hello Again! LLM-powered Personalized Agent for Long-term Dialogue". arXiv(2024) [paper] [code]
- CPD : "Position Debiasing Fine-Tuning for Causal Perception in Long-Term Dialogue". IJCAI(2024) [paper]
- TemporalMemory : "Toward Conversational Agents with Context and Time Sensitive Long-term Memory". arXiv(2024) [paper] [data]
- LoCoMo : "Evaluating Very Long-Term Conversational Memory of LLM Agents". ACL(2024) [paper] [data]
- Conversation Chronicles : "Conversation Chronicles: Towards Diverse Temporal and Relational Dynamics in Multi-Session Conversations". EMNLP(2023) [paper] [data]
- GapChat : "Mind the Gap Between Conversations for Improved Long-Term Dialogue Generation". EMNLP-Findings(2023) [paper] [data]
- UniMC : "UniMC: A Unified Framework for Long-Term Memory Conversation via Relevance Representation Learning". arXiv(2023) [paper]
- RS : "Recursively Summarizing Enables Long-Term Dialogue Memory in Large Language Models". arXiv(2023) [paper]
- MSC : "Beyond Goldfish Memory: Long-Term Open-Domain Conversation". ACL(2022) [paper] [data]
Response Generation
- Overview : "Open-domain Dialogue Generation: What We Can Do, Cannot Do, And Should Do Next". ACL-NLP4ConvAI(2022) [paper]
- Chirpy Cardinal : "Neural Generation Meets Real People: Building a Social, Informative Open-Domain Dialogue Agent". SIGDIAL(2022) [paper] [code] [project]
- TIL : "Towards Efficient Dialogue Pre-training with Transferable and Interpretable Latent Structure". EMNLP(2022) [paper]
- ProphetChat : "ProphetChat: Enhancing Dialogue Generation with Simulation of Future Conversation". ACL(2022) [paper]
- DialoFlow : "Conversations Are Not Flat: Modeling the Dynamic Information Flow across Dialogue Utterances". ACL(2021) [paper] [code]
- DiSCoL : "DiSCoL: Toward Engaging Dialogue Systems through Conversational Line Guided Response Generation". NAACL(2021) [paper] [code]
- DialogBERT : "DialogBERT: Discourse-Aware Response Generation via Learning to Recover and Rank Utterances". AAAI(2021) [paper]
- BlenderBot : "Recipes for Building an Open-Domain Chatbot". EACL(2021) [paper] [code]
- CDial-GPT : "A Large-Scale Chinese Short-Text Conversation Dataset". NLPCC(2020) [paper] [code]
- DialoGPT : "DialoGPT : Large-Scale Generative Pre-training for Conversational Response Generation". ACL(2020) [paper] [code]
- CG-Policy : "Conversational Graph Grounded Policy Learning for Open-Domain Conversation Generation". ACL(2020) [paper]
- PLATO-XL : "PLATO-XL: Exploring the Large-scale Pre-training of Dialogue Generation". arXiv(2021) [paper] [code]
- PLATO-2 : "PLATO-2: Towards Building an Open-Domain Chatbot via Curriculum Learning". ACL-Findings(2021) [paper] [code]
- PLATO : "PLATO: Pre-trained Dialogue Generation Model with Discrete Latent Variable". ACL(2020) [paper] [code]
- Guyu : "An Empirical Investigation of Pre-Trained Transformer Language Models for Open-Domain Dialogue Generation". arXiv(2020) [paper] [code]
- CL4Dialogue : "Group-wise Contrastive Learning for Neural Dialogue Generation". EMNLP-Findings(2020) [paper] [code]
- Neg-train : "Negative Training for Neural Dialogue Response Generation". ACL(2020) [paper] [code]
- HDSA : "Semantically Conditioned Dialog Response Generation via Hierarchical Disentangled Self-Attention". ACL(2019) [paper] [code]
- CAS : "Skeleton-to-Response: Dialogue Generation Guided by Retrieval Memory". NAACL(2019) [paper] [code]
- Edit-N-Rerank : "Response Generation by Context-aware Prototype Editing". AAAI(2019) [paper] [code]
- HVMN : "Hierarchical Variational Memory Network for Dialogue Generation". WWW(2018) [paper] [code]
- XiaoIce : "The Design and Implementation of XiaoIce, an Empathetic Social Chatbot". arXiv(2018) [paper]
- D2A : "Dialog-to-Action: Conversational Question Answering Over a Large-Scale Knowledge Base". NeurIPS(2018) [paper] [code]
- DAIM : "Generating Informative and Diverse Conversational Responses via Adversarial Information Maximization". NeurIPS(2018) [paper]
- REASON : "Dialog Generation Using Multi-turn Reasoning Neural Networks". NAACL(2018) [paper]
- STD/HTD : "Learning to Ask Questions in Open-domain Conversational Systems with Typed Decoders". ACL(2018) [paper] [code]
- CSF : "Generating Informative Responses with Controlled Sentence Function". ACL(2018) [paper] [code]
- DAWnet : "Chat More: Deepening and Widening the Chatting Topic via A Deep Model". SIGIR(2018) [paper] [code]
- ZSDG : "Zero-Shot Dialog Generation with Cross-Domain Latent Actions". SIGDIAL(2018) [paper] [code]
- DUA : "Modeling Multi-turn Conversation with Deep Utterance Aggregation". COLING(2018) [paper] [code]
- Data-Aug : "Sequence-to-Sequence Data Augmentation for Dialogue Language Understanding". COLING(2018) [paper] [code]
- DC-MMI : "Generating More Interesting Responses in Neural Conversation Models with Distributional Constraints". EMNLP(2018) [paper] [code]
- cVAE-XGate/CGate : "Better Conversations by Modeling, Filtering, and Optimizing for Coherence and Diversity". EMNLP(2018) [paper] [code]
- Retrieval+multi-seq2seq : "An Ensemble of Retrieval-Based and Generation-Based Human-Computer Conversation Systems". IJCAI(2018) [paper]
- DAM : "Multi-Turn Response Selection for Chatbots with Deep Attention Matching Network". ACL(2018) [paper] [code]
- SMN : "Sequential Matching Network: A New Architecture for Multi-turn Response Selection in Retrieval-Based Chatbots". ACL(2017) [paper] [code]
- CVAE/KgCVAE : "Learning Discourse-level Diversity for Neural Dialog Models using Conditional Variational Autoencoders". ACL(2017) [paper] [code]
- TA-Seq2Seq : "Topic Aware Neural Response Generation". AAAI(2017) [paper] [code]
- MA : "Mechanism-Aware Neural Machine for Dialogue Response Generation". AAAI(2017) [paper]
- VHRED : "A Hierarchical Latent Variable Encoder-Decoder Model for Generating Dialogues". AAAI(2017) [paper] [code]
- HRED : "Building End-To-End Dialogue Systems Using Generative Hierarchical Neural Network Models". AAAI(2016) [paper] [code]
- RL-Dialogue : "Deep Reinforcement Learning for Dialogue Generation". EMNLP(2016) [paper]
- MMI : "A Diversity-Promoting Objective Function for Neural Conversation Models". NAACL(2016) [paper] [code]
?トップに戻ります
Dialogue Evaluation
- DialogBench : "DialogBench: Evaluating LLMs as Human-like Dialogue Systems". NAACL(2024) [paper] [code]
- ChatEval : "ChatEval: Towards Better LLM-based Evaluators through Multi-Agent Debate". arXiv(2023) [paper] [code]
- ACCENT : "ACCENT: An Automatic Event Commonsense Evaluation Metric for Open-Domain Dialogue Systems". ACL(2023) [paper] [code]
- LLMEval : "Understanding the Effectiveness of Very Large Language Models on Dialog Evaluation". IWSDS(2023) [paper]
- ChatEvalPlatform : "Don't Forget Your ABC's: Evaluating the State-of-the-Art in Chat-Oriented Dialogue Systems". arXiv(2022) [paper] [code]
- MDD-Eval : "MDD-Eval: Self-Training on Augmented Data for Multi-Domain Dialogue Evaluation". AAAI(2022) [paper] [code]
- Self-Eval : "SelF-Eval: Self-supervised Fine-grained Dialogue Evaluation". COLING(2022) [paper] [code]
- FineD-Eval : "FineD-Eval: Fine-grained Automatic Dialogue-Level Evaluation". EMNLP(2022) [paper] [code]
- FlowEval : "FlowEval: A Consensus-Based Dialogue Evaluation Framework Using Segment Act Flows". EMNLP(2022) [paper]
- IM2 : "IM^2: an Interpretable and Multi-category Integrated Metric Framework for Automatic Dialogue Evaluation". EMNLP(2022) [paper] [code]
- Q^2 : "$Q^{2}$: Evaluating Factual Consistency in Knowledge-Grounded Dialogues via Question Generation and Question Answering". EMNLP(2021) [paper] [code]
- QuantiDCE : "Towards Quantifiable Dialogue Coherence Evaluation". ACL(2021) [paper] [code]
- DynaEval : "DynaEval: Unifying Turn and Dialogue Level Evaluation". ACL(2021) [paper] [code]
- Review : "How to Evaluate Your Dialogue Models: A Review of Approaches". arXiv(2021) [paper]
- ConvLabEval : "Is Your Goal-Oriented Dialog Model Performing Really Well? Empirical Analysis of System-wise Evaluation". SIGDIAL(2020) [paper]
- FED : "Unsupervised Evaluation of Interactive Dialog with DialoGPT". SIGDIAL(2020) [paper] [code] [data]
- Spot-the-Bot : "Spot The Bot: A Robust and Efficient Framework for the Evaluation of Conversational Dialogue Systems". EMNLP(2020) [paper] [code]
- CMADE : "Beyond User Self-Reported Likert Scale Ratings: A Comparison Model for Automatic Dialog Evaluation". ACL(2020) [paper] [code]
- Coherence : "Dialogue Coherence Assessment Without Explicit Dialogue Act Labels". ACL(2020) [paper] [code]
- MAUDE : "Learning an Unreferenced Metric for Online Dialogue Evaluation". ACL(2020) [paper] [code]
- GRADE : "GRADE: Automatic Graph-Enhanced Coherence Metric for Evaluating Open-Domain Dialogue Systems". ACL(2020) [paper] [code]
- uBLEU : "uBLEU: Uncertainty-Aware Automatic Evaluation Method for Open-Domain Dialogue Systems". ACL(2020) [paper] [code]
- USR : "USR: An Unsupervised and Reference Free Evaluation Metric for Dialog Generation". ACL(2020) [paper] [code]
- ACUTE-EVAL : "ACUTE-EVAL: Improved Dialogue Evaluation with Optimized Questions and Multi-turn Comparisons". NIPS ConvAI Workshop(2019) [paper] [code]
- InteractiveEval : "Approximating Interactive Human Evaluation with Self-Play for Open-Domain Dialog Systems". NeurIPS(2019) [paper] [code]
- ChatEval : "ChatEval: A Tool for Chatbot Evaluation". NAACL(2019) [paper] [project]
- ADVMT : "One
Ruler for All Languages: Multi-Lingual Dialogue Evaluation with Adversarial Multi-Task Learning". IJCAI(2018) [paper]
?トップに戻ります
Dialogue Misc.
- Signed-dialogue : "Generating Signed Language Instructions in Large-Scale Dialogue Systems". NAACL(2024) [paper] [data]
- Dialogue-KT : "Exploring Knowledge Tracing in Tutor-Student Dialogues". arXiv(2024) [paper] [code]
- MathDial : "MathDial: A Dialogue Tutoring Dataset with Rich Pedagogical Properties Grounded in Math Reasoning Problems". EMNLP-Findings(2023) [paper] [data]
- EduChat : "EduChat: A Large-Scale Language Model-based Chatbot System for Intelligent Education". arXiv(2023) [paper] [code]
- ACT : "Learning to Clarify: Multi-turn Conversations with Action-Based Contrastive Self-Training". arXiv(2024) [paper]
- ReviewMT : "Peer Review as A Multi-Turn and Long-Context Dialogue with Role-Based Interactions". arXiv(2024) [paper] [code]
- WildChat : "WildChat: 1M ChatGPT Interaction Logs in the Wild". ICLR(2024) [paper] [data]
- DialOp : "Decision-Oriented Dialogue for Human-AI Collaboration". arXiv(2023) [paper] [code]
- DialogStudio : "DialogStudio: Towards Richest and Most Diverse Unified Dataset Collection for Conversational AI". arXiv(2023) [paper] [code]
- MPC : "Multi-Party Chat: Conversational Agents in Group Settings with Humans and Models". arXiv(2023) [paper] [code]
- SODA : "SODA: Million-scale Dialogue Distillation with Social Commonsense Contextualization". EMNLP(2023) [paper] [code]
- speaker-adaptation : "Speaking the Language of Your Listener: Audience-Aware Adaptation via Plug-and-Play Theory of Mind". ACL-Findings(2023) [paper] [code]
- SocialDial : "SocialDial: A Benchmark for Socially-Aware Dialogue Systems". SIGIR(2023) [paper] [data]
- BotsTalk : "BotsTalk: Machine-sourced Framework for Automatic Curation of Large-scale Multi-skill Dialogue Datasets". EMNLP(2022) [paper] [code]
- Dialogic : "Dialogic: Controllable Dialogue Simulation with In-Context Learning". EMNLP-Findings(2022) [paper] [code]
- ProsocialDialog : "ProsocialDialog: A Prosocial Backbone for Conversational Agents". EMNLP(2022) [paper] [code]
- MIC : "The Moral Integrity Corpus: A Benchmark for Ethical Dialogue Systems". ACL(2022) [paper] [code]
- MoralDial : "MoralDial: A Framework to Train and Evaluate Moral Dialogue Systems via Constructing Moral Discussions". arXiv(2022) [paper]
- DECODE : "I like fish, especially dolphins: Addressing Contradictions in Dialogue Modeling". ACL(2021) [paper] [code]
?トップに戻ります
Natural Language Generation
Survey on NLG
- CTG : "A Survey of Controllable Text Generation using Transformer-based Pre-trained Language Models". arXiv(2022) [paper]
- RTG : "A Survey on Retrieval-Augmented Text Generation". arXiv(2022) [paper]
- Hallucination : "Survey of Hallucination in Natural Language Generation". arXiv(2022) [paper]
- Evaluation : "A Survey of Evaluation Metrics Used for NLG Systems". arXiv(2020) [paper]
?トップに戻ります
NLG Theories and Techniques
- RED : "Decoder-Only or Encoder-Decoder? Interpreting Language Model as a Regularized Encoder-Decoder". arXiv(2023) [paper]
- LaMemo : "LaMemo: Language Modeling with Look-Ahead Memory". NAACL(2022) [paper] [code]
- PTG : "Learning to Transfer Prompts for Text Generation". NAACL(2022) [paper] [code]
- EISL : "Don't Take It Literally: An Edit-Invariant Sequence Loss for Text Generation". NAACL(2022) [paper] [code]
- CT-Loss : "A Simple Contrastive Learning Objective for Alleviating Neural Text Degeneration". arXiv(2022) [paper] [code]
- SimCTG : "A Contrastive Framework for Neural Text Generation". NeurIPS(2022) [paper] [code]
- CoNT : "CoNT: Contrastive Neural Text Generation". NeurIPS(2022) [paper] [code]
- Two-level-CL : "Keywords and Instances: A Hierarchical Contrastive Learning Framework Unifying Hybrid Granularities for Text Generation". ACL(2022) [paper]
- CLAPS : "Contrastive Learning with Adversarial Perturbations for Conditional Text Generation". ICLR(2021) [paper] [code]
- RetGen : "RetGen: A Joint framework for Retrieval and Grounded Text Generation Modeling". AAAI(2022) [paper] [code]
- RAG : "Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks". NeurIPS(2020) [paper] [code]
- TextGAIL : "TextGAIL: Generative Adversarial Imitation Learning for Text Generation". AAAI(2021) [paper] [code]
- Latent-GLAT : " latent -GLAT: Glancing at Latent Variables for Parallel Text Generation". ACL(2022) [paper] [code]
- s2s-ft : "s2s-ft: Fine-Tuning Pretrained Transformer Encoders for Sequence-to-Sequence Learning". arXiv(2021) [paper] [code]
- EBM : "Exposure Bias versus Self-Recovery: Are Distortions Really Incremental for Autoregressive Text Generation?". EMNLP(2021) [paper]
- DiscoDVT : "DiscoDVT: Generating Long Text with Discourse-Aware Discrete Variational Transformer". EMNLP(2021) [paper] [code]
- DATG : "Data Augmentation for Text Generation Without Any Augmented Data". ACL(2021) [paper]
- JointGT : "JointGT: Graph-Text Joint Representation Learning for Text Generation from Knowledge Graphs". ACL-Findings(2021) [paper] [code]
- Embedding-Transfer : "Bridging Subword Gaps in Pretrain-Finetune Paradigm for Natural Language Generation". ACL(2021) [paper] [code]
- FastSeq : "EL-Attention: Memory Efficient Lossless Attention for Generation". ICML(2021) [paper] [code]
- BERTSeq2Seq : "Leveraging Pre-trained Checkpoints for Sequence Generation Tasks". TACL(2020) [paper] [code-tf] [code-py]
- ERNIE-GEN : "ERNIE-GEN: An Enhanced Multi-Flow Pre-training and Fine-tuning Framework for Natural Language Generation". IJCAI(2020) [paper] [code]
- DITTO : "Learning to Break the Loop: Analyzing and Mitigating Repetitions for Neural Text Generation". NeurIPS(2022) [paper] [code]
- Repetition-Problem : "A Theoretical Analysis of the Repetition Problem in Text Generation". AAAI(2021) [paper] [code]
- ENCONTER : "ENCONTER: Entity Constrained Progressive Sequence Generation via Insertion-based Transformer". EACL(2021) [paper] [code]
- POINTER : "POINTER: Constrained Progressive Text Generation via Insertion-based Generative Pre-training". EMNLP(2020) [paper] [code]
- Cascaded Generation : "Cascaded Text Generation with Markov Transformers". NeurIPS(2020) [paper] [code]
- SFOT : "Improving Text Generation with Student-Forcing Optimal Transport". EMNLP(2020) [paper]
- OT-Seq2Seq : "Improving Sequence-to-Sequence Learning via Optimal Transport". ICLR(2019) [paper] [code]
?トップに戻ります
Diffusion Models for NLG
- RenderDiffusion : "RenderDiffusion: Text Generation as Image Generation". arXiv(2023) [paper]
- Masked-Diffusion-LM : "A Cheaper and Better Diffusion Language Model with Soft-Masked Noise". arXiv(2023) [paper] [code]
- discrete-diffusion : "A Reparameterized Discrete Diffusion Model for Text Generation". arXiv(2023) [paper] [code]
- Difformer : "Difformer: Empowering Diffusion Models on the Embedding Space for Text Generation". arXiv(2023) [paper]
- GENIE : "Text Generation with Diffusion Language Models: A Pre-training Approach with Continuous Paragraph Denoise". arXiv(2022) [paper] [code]
- SED : "Self-conditioned Embedding Diffusion for Text Generation". arXiv(2022) [paper]
- SSD-LM : "SSD-LM: Semi-autoregressive Simplex-based Diffusion Language Model for Text Generation and Modular Control". arXiv(2022) [paper] [code]
- LD4LG : "Latent Diffusion for Language Generation". arXiv(2022) [paper] [code]
- DiffusionBERT : "DiffusionBERT: Improving Generative Masked Language Models with Diffusion Models". arXiv(2022) [paper] [code]
- DiffusER : "DiffusER: Discrete Diffusion via Edit-based Reconstruction". arXiv(2022) [paper] [code]
- SeqDiffuSeq : "SeqDiffuSeq: Text Diffusion with Encoder-Decoder Transformers". arXiv(2022) [paper] [code]
- DiffuSeq : "DiffuSeq: Sequence to Sequence Text Generation with Diffusion Models". ICLR(2023) [paper] [code]
- Diffusion-LM : "Diffusion-LM Improves Controllable Text Generation". NeurIPS(2022) [paper] [code]
- D3PM : "Structured Denoising Diffusion Models in Discrete State-Spaces". NeurIPS(2021) [paper] [code]
?トップに戻ります
Controllable Generation
- ConGenBench : "Controllable Text Generation in the Instruction-Tuning Era". arXiv(2024) [paper] [code]
- GeLaTo : "Tractable Control for Autoregressive Language Generation". arXiv(2023) [paper]
- Cognac : "Controllable Text Generation with Language Constraints". arXiv(2022) [paper] [code]
- CriticControl : "Critic-Guided Decoding for Controlled Text Generation". arXiv(2022) [paper]
- LatentOps : "Composable Text Controls in Latent Space with ODEs". arXiv(2022) [paper] [code]
- FAST : "FAST: Improving Controllability for Text Generation with Feedback Aware Self-Training". arXiv(2022) [paper]
- DisCup : "DisCup: Discriminator Cooperative Unlikelihood Prompt-tuning for Controllable Text Generation". EMNLP(2022) [paper] [code]
- MultiControl : "A Distributional Lens for Multi-Aspect Controllable Text Generation". EMNLP(2022) [paper] [code]
- NADO : "Controllable Text Generation with Neurally-Decomposed Oracle". NeurIPS(2022) [paper] [code]
- Mix-Match : "Mix and Match: Learning-free Controllable Text Generation using Energy Language Models". ACL(2022) [paper] [code]
- ControlPrefix : "Controllable Natural Language Generation with Contrastive Prefixes". ACL-Findings(2022) [paper]
- MUCOCO : "Controlled Text Generation as Continuous Optimization with Multiple Constraints". NeurIPS(2021) [paper] [code]
- DExperts : "DExperts: Decoding-Time Controlled Text Generation with Experts and Anti-Experts". ACL(2021) [paper] [code]
- FUDGE : "FUDGE: Controlled Text Generation With Future Discriminators". NAACL(2021) [paper] [code]
- GeDi : "GeDi: Generative Discriminator Guided Sequence Generation". EMNLP-Findings(2021) [paper] [code]
- GDC : "A Distributional Approach to Controlled Text Generation". ICLR(2021) [paper] [code]
- CoCon : "CoCon: A Self-Supervised Approach for Controlled Text Generation". ICLR(2021) [paper] [code]
- PPLM : "Plug and Play Language Models: A Simple Approach to Controlled Text Generation". ICLR(2020) [paper] [code]
- CTRL : "CTRL: A Conditional Transformer Language Model for Controllable Generation". arXiv(2019) [paper] [code]
?トップに戻ります
Text Planning
- CoScript : "Distilling Script Knowledge from Large Language Models for Constrained Language Planning". ACL(2023) [paper] [code]
- RSTGen : "RSTGen: Imbuing Fine-Grained Interpretable Control into Long-FormText Generators". NAACL(2022) [paper]
- Time Control : "Language Modeling via Stochastic Processes". ICLR(2022) [paper] [code]
- PLANET : "PLANET: Dynamic Content Planning in Autoregressive Transformers for Long-form Text Generation". ACL(2022) [paper]
- EventPlan : "Event Transition Planning for Open-ended Text Generation". ACL-Findings(2022) [paper] [code]
- CETP : "Knowledge-based Review Generation by Coherence Enhanced Text Planning". SIGIR(2021) [paper]
- PlanGen : "Plan-then-Generate: Controlled Data-to-Text Generation via Planning". EMNLP-Findings(2021) [paper] [code]
- DYPLOC : "DYPLOC: Dynamic Planning of Content Using Mixed Language Models for Text Generation". ACL(2021) [paper] [code]
- Tree-PLAN : "Infobox-to-text Generation with Tree-like Planning based Attention Network". IJCAI(2020) [paper]
- ProphetNet : "ProphetNet: Predicting Future N-gram for Sequence-to-Sequence Pre-training". EMNLP-Findings(2020) [paper] [code]
- PAIR : "PAIR: Planning and Iterative Refinement in Pre-trained Transformers for Long Text Generation". EMNLP(2020) [paper] [code]
- SentPlan : "Sentence-Level Content Planning and Style Specification for Neural Text Generation". EMNLP(2019) [paper] [code]
- PHVM : "Long and Diverse Text Generation with Planning-based Hierarchical Variational Model". EMNLP(2019) [paper] [code]
- TwinNet : "Twin Networks: Matching the Future for Sequence Generation". ICLR(2018) [paper] [code]
- PAG : "Plan, Attend, Generate: Planning for Sequence-to-Sequence Models". NIPS(2017) [paper]
?トップに戻ります
Decoding Algorithms
- Speculative Decoding : "Speculative Decoding: Exploiting Speculative Execution for Accelerating Seq2seq Generation". EMNLP-Findings(2023) [paper] [code]
- Medusa : "Medusa: Simple Framework for Accelerating LLM Generation with Multiple Decoding Heads". Github(2023) [Blog] [code]
- Lookahead Decoding : "Breaking the Sequential Dependency of LLM Inference Using Lookahead Decoding". LMSYS Org(2023) [Blog] [code]
- Speculative Sampling : "Accelerating Large Language Model Decoding with Speculative Sampling". arXiv(2023) [paper]
- Speculative Decoding : "Fast Inference from Transformers via Speculative Decoding". ICML(2023) [paper] [code]
- Parallel Decoding : "Accelerating Transformer Inference for Translation via Parallel Decoding". ACL(2023) [paper] [code]
- EAD : "The Stable Entropy Hypothesis and Entropy-Aware Decoding: An Analysis and Algorithm for Robust Natural Language Generation". arXiv(2023) [paper] [code]
- Contrastive Search : "Contrastive Search Is What You Need For Neural Text Generation". TMLR(2023) [paper] [code] [blog]
- Momentum Decoding : "Momentum Decoding: Open-ended Text Generation As Graph Exploration". arXiv(2022) [paper] [code]
- Crowd Sampling : "Follow the Wisdom of the Crowd: Effective Text Generation via Minimum Bayes Risk Decoding". arXiv(2022) [paper] [code]
- RankGen : "RankGen: Improving Text Generation with Large Ranking Models". EMNLP(2022) [paper] [code]
- Contrastive Decoding : "Contrastive Decoding: Open-ended Text Generation as Optimization". arXiv(2022) [paper] [code]
- COLD : "COLD Decoding: Energy-based Constrained Text Generation with Langevin Dynamics". NeurIPS(2022) [paper] [code]
- Lattice : "Massive-scale Decoding for Text Generation using Lattices". NAACL(2022) [paper] [code]
- KID : "Knowledge Infused Decoding". ICLR(2022) [paper] [code]
- NeuroLogic A*esque : "NeuroLogic A *esque Decoding: Constrained Text Generation with Lookahead Heuristics". NAACL(2022) [paper] [code]
- NeuroLogic : "NeuroLogic Decoding: (Un)supervised Neural Text Generation with Predicate Logic Constraints". NAACL(2021) [paper] [code]
- DeLorean : "Back to the Future: Unsupervised Backprop-based Decoding for Counterfactual and Abductive Commonsense Reasoning". EMNLP(2020) [paper] [code]
- Top-p (Nucleus) Sampling : "The Curious Case of Neural Text Degeneration". ICLR(2020) [paper] [code]
- BP Decoding : "Blockwise Parallel Decoding for Deep Autoregressive Models". NIPS(2018) [paper]
- Disjunctive Constraints : "Guided Generation of Cause and Effect". IJCAI(2020) [paper] [code-huggingface]
- CGMH : "CGMH: Constrained Sentence Generation by Metropolis-Hastings Sampling". AAAI(2019) [paper] [code]
- DBS : "Directed Beam Search: Plug-and-Play Lexically Constrained Language Generation". arXiv(2020) [paper] [code]
- DBA : "Fast Lexically Constrained Decoding with Dynamic Beam Allocation for Neural Machine Translation". NAACL(2018) [paper] [code-official] [code-fairseq]
- GBS : "Lexically Constrained Decoding for Sequence Generation Using Grid Beam Search". ACL(2017) [paper] [code]
?トップに戻ります
NLG Evaluation
- Survey : "Leveraging Large Language Models for NLG Evaluation: A Survey". arXiv(2024) [paper]
- BBScore : "BBScore: A Brownian Bridge Based Metric for Assessing Text Coherence". AAAI(2024) [paper]
- GPTEval : "GPTEval: NLG Evaluation using GPT-4 with Better Human Alignment". arXiv(2023) [paper]
- GPTScore : "GPTScore: Evaluate as You Desire". arXiv(2023) [paper] [code]
- RoMe : "RoMe: A Robust Metric for Evaluating Natural Language Generation". ACL(2022) [paper] [code]
- EAD : "Rethinking and Refining the Distinct Metric". ACL(2022) [paper] [code]
- MID : "Mutual Information Divergence: A Unified Metric for Multimodal Generative Models". NeurIPS(2022) [paper]
- DiscoScore : "DiscoScore: Evaluating Text Generation with BERT and Discourse Coherence". arXiv(2022) [paper] [code]
- CTC-Score : "Compression, Transduction, and Creation: A Unified Framework for Evaluating Natural Language Generation". EMNLP(2021) [paper] [code]
- BLEURT : "BLEURT: Learning Robust Metrics for Text Generation". ACL(2020) [paper] [code]
?トップに戻ります