Awesome-llm-role-playing-agents:大規模な言語モデル、ペルソナ、ロールプレイングエージェントのリソースのキュレーションリスト。
このレポは、主に架空のキャラクター、有名人、歴史上の人物などのキャラクターのロールプレイングに焦点を当てています。ロールプレイング言語エージェントは、マルチエージェントシステムやロングコンテキストモデルなど、多くの研究トピックに関連していますが、これらの分野に論文を含めることを保証することはできません。
興味のある他のペーパーリストは次のとおりです。
ペルソナペーパー:ペルソナベースのダイアログシステムとパーソナライズされた応答生成に関連する論文のリスト。
? LLMと社会: (1)LLMSの心理学に関する最近の論文。 (2)LLMSのバイアス。
? LLMエージェントペーパー:大規模な言語モデルエージェントに関する必見の論文。
2024-10-09?私たちの調査論文「ペルソナからパーソナライズまで:ロールプレイング言語エージェントに関する調査」 [Arxiv]はTMLRに受け入れられました!
2024-08-19 FYI:Boson AIは、ベンチマーク[RPBenchリーダーボード]とオープンソースモデル[Higgs-llama-3 70b V2]をリリースしました。
2024-06-28このレポンを再編成し、ロールプレイングエージェントに重点を置いています。
2024-04-30私たちは調査論文を発表することに非常に興奮しています:「ペルソナからパーソナライズまで:ロールプレイング言語エージェントに関する調査」 [arxiv]
2024-04-17このトピックに関する研究に興味のある協力者を探しています。メールでお問い合わせください:[email protected]
2023-10-30このリポジトリを作成して、割り当てられたペルソナを使用したLLMSロールプレイングに関するペーパーリストを維持します。
確立された文字
ペルソナからパーソナライズまで:ロールプレイング言語エージェントに関する調査。
ヤンジー・チェン、XINTAO王、ルイ・XU、シュユ・ユーアン、Yikai Zhang、Wei Shi、Jian Xie、Shuang Li、Ruihan Yang、Tinghui Zhu、Aili Chen、Nianqi Li、Lida Chen、Caiyu Hu、 、Yanghua Xiao。 [AB]、TMLR 2024.04
Incharacter:心理的インタビューを通じて、ロールプレイングエージェントの性格の忠実度を評価します。 (以前:ロールプレイングチャットボットはキャラクターの性格をキャプチャしますか?ロールプレイングチャットボットの性格特性の評価)
Xintao Wang、Yunze Xiao、Jen-Tse Huang、Siyu Yuan、Rui Xu、Haoran Guo、Quan Tu、Yaying Fei、Ziang Leng、Wei Wang、Jiangjie Chen、Cheng Li、Yanghua Xiao。 [ABS]、ACL 2024
Rolellm:大規模な言語モデルのロールプレイング能力のベンチマーク、誘発、および強化。
Zekun Moore Wang、Zhongyuan Peng、Haoran Que、Jiaheng Liu、Wangchunshu Zhou、Yuhan Wu、Hongcheng Guo、Ruitong Gan、Zehao Ni、Man Zhang、Zhaoxiang Zhang、Wanli ouyang、Ke Xu、wenhu chen、jie fu、ke xu。 、[abs]、ACL 2024の発見
Chatharuhi:大規模な言語モデルを介して現実にアニメキャラクターを復活させます。
チェン・リー、ジアン・レン、チェンシ・ヤン、ジュニー・シェン、ハオ・ワン、ヴェイシ・ミー、Yaying Fei、Xiaoyang Feng、Song Yan、Haosheng Wang、Linkang Zhan、Yaokai Jia、Pingyu Wu、Haozhen Sun。 [abs]、2023.8
Character-LLM:ロールプレイングのためのトレーニング可能なエージェント。
ユンファン・シャオ、リンヤン・リー、ジュンキ・ダイ、Xipeng Qiu。 、[abs]、emnlp 2023
架空のキャラクターのロールプレイにおける幻覚を軽減します
Nafis Sadeq、Zhouhang Xie、Byungkyu Kang、Prarit Lamba、Xiang Gao、Julian McAuley。 、[abs] [データセット]、EMNLP 2024の調査結果
ペルソナ主導のロールプレイングにおけるグローバルな忠実さの定量化と最適化
レティアン・ペン、ジンボ・シャン。 、[abs] [データセット]、ニューリップ2024
CharpleGLM:大規模な言語モデルで中国の会話型AIキャラクターをカスタマイズします。 Jinfeng Zhou、Zhuang Chen、Dazhen Wan、Bosi Wen、Yi Song、Jifan Yu、Yongkang Huang、Libiao Peng、Jiaming Yang、Xiyao Xiao、Sahand Sabour、Xiaohan Zhang、Wenjing Hou、Yijia Zhang、Yucing、Yujan 。 、[abs]、2023.11
PIPPA:部分的に合成会話データセットティアセットゴスリング、アルピンデール、Yinhe Zheng。 [abs]、2023.08
キャラクターは運命です:大規模な言語モデルは、ロールプレイにおいてペルソナ主導の決定をシミュレートすることができますか?
Rui Xu、Xintao Wang、Jiangjie Chen、Siyu Yuan、Xinfeng Yuan、Jiaqing Liang、Zulong Chen、Xiaoqing Dong、Yanghua Xiao。 [AB]、2024.04
大規模な言語モデルは、すべてのキャラクターの重ね合わせです。自己調整Keming Lu、Bowen Yu、Chang Zhou、Jingren Zhouを介して任意のロールプレイを達成します。 、[abs]、2024.01
大規模な言語モデルは、ハリー・ポッターに出会う:ダイアログエージェントをキャラクターに合わせるためのバイリンガルデータセット。 Nuo Chen、Yan Wang、Haiyun Jiang、Deng Cai、Yuhan Li、Ziyang Chen、Longyue Wang、Jia Li。 、[abs]、2022.11
架空の作品からのキャラクタープロファイリングを介した大規模な言語モデルのキャラクターの理解を評価するXinfeng Yuan、Siyu Yuan、Yuhan Cui、Tianhe Lin、Xintao Wang、Rui Xu、Jiangjie Chen、Deqing Yang。 [AB]、2024.04
ロールプレイからドラマの相互作用まで:LLMソリューションWeiqi Wu、Hongqiu Wu、Lai Jiang、Xingyuan Liu、Jiale Hong、Hai Zhao、Min Zhang。 [ABS]、ACL 2024の調査結果
タイムカラ:ポイントインタイムキャラクターのロールプレイングラージランゲージモデルの評価の評価Jaewoo Ahn、Taehyun Lee、Junyoung Lim、Jin-Hwa Kim、Sangdoo Yun、Hwaran Lee、Gunhee Kim。 [ABS]、ACL 2024の調査結果
「あなたのキャラクターに彼らの物語を語らせてください」:キャラクター中心の物語を理解するためのデータセットファイズ・ブラフマン、メン・ファン、オイビンド・タフィョルド、チャオ・ザオ、ムリニャヤ・サチャン、スニグダ・チャトゥルヴェディ。 、[abs]、EMNLP調査結果2021
CharitionEval:ロールプレイング会話エージェントの評価のための中国のベンチマーク。 Quan Tu、Shilong Fan、Zihang Tian、Rui Yan。 、[abs]、ACL 2024
Neeko:効率的なマルチキャラクターロールプレイエージェントXiaoyan Yu、Tongxu Luo、Yifan Wei、Fangyu Lei、Yiming Huang、Hao Peng、Liehuang Zhuの動的Loraを活用します。 、[abs]、2024.02
ロリーバル:大規模な言語モデルのバイリンガルロール評価ベンチマークTianhao Shen、Sun Li、Quan Tu、Deyi Xiong。 [abs]、2023.12
Erabal:境界を認識した学習を通じて、ロールプレイングエージェントの強化Yihong Tang、Jiao OU、Che Liu、Fuzheng Zhang、Di Zhang、Kun Gai。 [abs]、2024.09
ソーシャルベンチ:ロールプレイングの会話エージェントのソーシャル評価ホンツハンチェン、ヘホンチェン、ミンヤン、ウェンシェンXu、シンガオ、ヴァイツーシェン、シアオジュンクアン、チェンリングLi [ABS]、2024.03
言葉だけでなく、心を捕らえる:人格を指示するデータを使用してロールプレイング言語モデルを強化するYitting Ran、Xintao Wang、Rui Xu、Xinfeng Yuan、Jiaqing Liang、Yanghua Xiao、Deqing Yang。 [ABS]、EMNLP 2024の調査結果
MMrole:マルチモーダルのロールプレイングエージェントYanqi Dai、Huanran Hu、Lei Wang、Shengjie Jin、Xu Chen、Zhiwu Lu。 [AB]、2024.08
LLMのキャラクター知識エラーを検出するという課題を明らかにします。 [abs]、2024.09
対話を超えて:一般的なロールプレイング言語モデルのYeyong Yu、Runsheng Yu、Haojie Wei、Zhanqiu Zhang、Quan Qianに向けたプロファイルダイアログアライメントフレームワーク。 [AB]、2024.08
Prodigy:プロファイルベースのダイアログ生成データセットDaniela Occhipinti、Serra Sinem Tekiroglu、Marco Guerini [abs] [Dataset]、NAACL INSURTS 2024
オリジナル文字
1,000,000,000のペルソナXin Chan、Xiaoyang Wang、Dian Yu、Haitao Mi、Dong Yuによる合成データ作成のスケーリング。 [abs]、2024.06
STARK:ペルソナとの社会的長期のマルチモーダル会話知識Young-Jun Lee、Dokyong Lee、Junyoung Youn、Kyeongjin Oh、Byungsoo Ko、Jonghwan Heeon、Ho-Jin Choi。 [abs]、emnlp 2024
ペルソジム:ペルソナエージェントとLLMSヴィナイサミュエル、ヘンリーペンズウ、ユエチョウ、シュレヤスチョードハリ、アシュウィンカリャン、タンメイラジプロヒット、アミートデシュパンデ、カルティクナラシムハン、ヴィシュヴァッバクマハリ。 [abs]、2024.10
ExpertPrompting:大規模な言語モデルに際立った専門家に指示する
Benfeng Xu、Yang、Junyang Lin、Quan Wang、Chang Zhou、Yongdong Zhang、Zhendong Mao。 [abs]、2023.5
chatgptの毒性:ペルソナが割り当てられた言語モデルの分析
Ameet Deshpande、Vishvak Murahari、Tanmay Rajpurohit、Ashwin Kalyan、Karthik Narasimhan。 [AB]、2023.4
Aobo Kong、Shiwan Zhao、Hao Chen、Qicheng Li、Yong Qin、Ruiqi Sun、Xin Zhouを促すロールプレイを備えたより良いゼロショット推論。 [abs]、2023.8
バイアスは深く動作します:ペルソナが割り当てられたLLMSシャシャンクグプタ、ヴァイシュナヴィシュリバスタバ、アミートデシュパンデ、アシュウィンカリャン、ピータークラーク、アシュシュサバルワル、ティーシャルコット[ABS]、2023.111111111111111111111111
「役立つアシスタント」は大規模な言語モデルにとって最良の役割ですか?システムプロンプトにおける社会的役割の体系的な評価。 Mingqian Zheng、Jiaxin Pei、David Jurgens [abs]、2023.11
堆肥:LLMシミュレーションの似顔絵の特性評価と評価Myra Cheng、ティジアーノピッカルディ、ディイヤン。 [abs]、2023.10
事前に訓練された言語モデルのステレオタイプの解読Weicheng Ma、Henry Scheible、Brian Wang、Goutham Veeramachaneni、Pratim Chowdhary、Alan Sun、Andrew Koulogeorge、Lili Wang、Diyi Yang、Soroush vosoughi。 [AB]、EMNLP調査結果2023
Culturellm:文化的な違いを大規模な言語モデルに組み込むCheng Li、Mengzhou Chen、Jindong Wang、Sunayana Sitaram、Xing Xie。 [AB]、2024.02
ペルソナの選択と価値 - 信念 - ノームの推論Cdo Xuan long、Kenji Kawaguchi、Min Yen Kan、Nancy F Chenを通じて、人間の意見で大規模な言語モデルを調整します。 [AB]、2024.11
ランプ:大規模な言語モデルがパーソナライズに会ったとき、アリレザ・サレミ、シェシェラ・マイソール、マイケル・ベンデルスキー、ハメド・ザマニ[abs]、2023.04。
LLMSは私たちをどれだけうまくエコーできますか? Echo Man Tik Ng、Hui Tung Tse、Jen-Tse Huang、Jingjing Li、Wenxuan Wang、Michael R. LyuとのAIチャットボットのロールプレイ能力の評価。 [AB]、2024.04
データ駆動型のペルソナへの大規模な言語モデルの操縦性Junyi Li、Ninareh Mehrabi、Charith Peris、Palash Goyal、Kai-Wei Chang、Aram Galstyan、Richard Zemel、Rahul Gupta [abs]、Naacl 2024。
ショー、言わない:言語モデルを実証されたフィードバックオマールシャイク、ミシェルラム、ジョーイヘイナ、イジアシャオ、マイケルバーンスタイン、ディイヤン[abs]、2024.06
PERSLLM:大規模な言語モデルの擬人化されたトレーニングアプローチZheni Zeng、Jiayi Chen、Huimin Chen、Yukun Yan、Yuxuan Chen、Zhenghao Liu、Zhiyuan Liu、Maosong Sun [abs]、2024.07
LiveChat:ライブストリーミングから自動的に構築された大規模なパーソナライズされたダイアログデータセット
Jingsheng Gao、Yixin Lian、Ziyi Zhou、Yuzhuo Fu、Baoyuan Wang。 [abs]、2023.6。タグ:ストリーマーペルソナ。
コスプレ:コンセプトセットの両方のパーティーのペルソナであるJingsheng Gao、Yixin Lian、Ziyi Zhou、Yuzhuo Fu、Baoyuan Wangの概念セットガイド付きパーソナライズされた対話生成。 [AB]、シギル2022。
パーソナライズダイアログエージェント:私は犬を飼っています、あなたもペットを持っていますか?サイゼン・チャン、エミリー・ディナン、ジャック・アーバネク、アーサー・スズラム、ドゥーウェ・キエラ、ジェイソン・ウェストン。 [ABS]、ACL 2018。
MPCHAT:マルチモーダルのペルソナグラウンドの会話に向けて、 Jaewoo Ahn、Yeda Song、Sangdoo Yun、Gunhee Kim。 [AB]、ACL2023。Tags:マルチモーダルペルソナ。
インタラクショングラウンド学習(IGL)ジェシカマガキアン、ポールミネイロ、キシャンパナガンティ、マークラッカー、アカンクシャサラン、チェンタン[AB]、2022.11。
大規模な言語モデルがパーソナライゼーションを満たすとき:課題と機会の視点ジンチェン、Zheng liu、Xu Huang、Chenwang Wu、Qi Liu、Gangwei Jiang、Yuanhao PU、Yuxuan Lei、Xiaolong Chen、Xingmei Wang、Dedu Lian、 Enhon 、2023.07、調査。
チャットボットを超えて:構造化された思考とパーソナライズされたモデル応答のExplorellm Xiao Ma、Swaroop Mishra、Ariel Liu、Sophie SU、Jilin Chen、Chinmay Kulkarni、Heng-Tze Cheng、Quoc Le、Ed Chi [abs]、2023.12。
パーソナリティチャット:事実と特性を備えたパーソナライズされたダイアログモデリングの会話の蒸留ehsan lotfi、マキシムデブルーイン、ジェスカブフマン、ウォルターダイレマンス。 [AB]、2024.01。
人口統計を超えて:人間の信念ネットワークを使用したロールプレイングLLMベースのエージェントの調整Yun-Shiuan Chuang、Krirk Nirunwiroj、Zach Studdiford、Agam Goyal、Vincent V. Frigo、Sijia Yang、Dhavan Shah、Junjie Hu、Timothy T. Rogers。 [abs]、2024.06
1,000人のジュンソンパーク、キャロリンQ.ゾウ、アーロンショー、ベンジャミンマコヒル、キャリーカイ、メレディスリンゲルモリス、ロブウィラー、パーシーリアン、マイケルS.バーンスタインの生成エージェントシミュレーション。 [AB]、2024.11
生成エージェント:人間の行動のインタラクティブなシミュレーションジュンソンパーク、ジョセフC.オブライエン、キャリーJ.カイ、メレディスリンゲルモリス、パーシーリアン、マイケルS.バーンスタイン。 [abs]、2023.04。
ソフトウェア開発のためのコミュニケーションエージェントチェンチアン、シンコン、ウェイリウ、チェンヤン、ワイズチェン、ユシェンSU、ユファンダン、ジャハオLI、ジュユアンXU、ダハイリー、Zhiyuan Li、Maosong Sun. [abs]、2023.07。
Corex:マルチモデルコラボレーションを通じて、複雑な推論の境界を押し進めます。 Qiushi Sun、Zhangyue Yin、Xiang Li、Zhiyong Wu、Xipeng Qiu、Lingpeng Kong。 [abs]、2023.09。
Avalonbench:AvalonのゲームをプレイするLLMSの評価。ジョナサン・ライト、ミン・カイ、シェン・シェン、ジニウ・フー。 [abs]、2023.10。
戦争と平和(Waragent):世界大戦の大規模な言語モデルベースのマルチエージェントシミュレーション。 Wenyue Hua、Lizhou Fan、Lingyao Li、Kai Mei、Jianchao Ji、Yingqiang GE、Libby Hemphill、Yongfeng Zhang。 [abs]、2023.11。
ワード推測ゲームを活用して、大規模な言語モデルのインテリジェンスを評価します。 Tian Liang、Zhiwei He、Jen-Tse Huang、Wenxuan Wang、Wenxiang Jiao、Rui Wang、Yujiu Yang、Zhaopeng Tu、Shuming Shi、Xing Wang。 [abs]、2023.10。
Anteval:エージェントの社会的相互作用の情報性と表現力を定量的に評価します。 Yuanzhi Liang、Linchao Zhu、Yi Yang。 [AB]、2024.01。
交換:クロスモデル通信Zhangyue Yin、Qiushi Sun、Cheng Chang、Qipeng Guo、Junqi Dai、Xuanjing Huang、Xipeng Qiuを通じて、大規模な言語モデル機能の強化。 [AB]、2024.01。
LLMエージェントのコラボレーションメカニズムの調査:社会心理学の見解Jintian Zhang、Xin Xu、Ningyu Zhang、Ruibo Liu、Bryan Hooi、Shumin Deng。 [abs]、2023.10
シミュレートされた社会的相互作用に関する社会的に整合した言語モデルのトレーニングRuibo Liu、Ruixin Yang、Chenyan Jia、Ge Zhang、Diyi Yang、Soroush Vosoughi。 [AB]、ICLR 2024
LLMSの意思決定をどこまで行っていますか?マルチエージェント環境でのLLMSのゲーム能力の評価Jen-Tse Huang、Eric John Li、Man Ho Lam、Tian Liang、Wenxuan Wang、Youliang Yuan、Wenxiang Jiao、Xing Wang、Zhaopeng Tu、Michael R. Lyu。 [ABS]、2024.03
エージェントグループチャット:集合的な緊急行動をより良く引き出すためのインタラクティブなグループチャットシミュラクラ、 Zhouhong Gu、Xiaoxuan Zhu、Haoran Guo、Lin Zhang、Yin Cai、Hao Shen、Jiangjie Chen、Zheyu Ye、Yifei Dai、Yan Gao、 Xiao [abs]、 2024.03
これは実生活ですか?これはただのファンタジーですか? LLMS Xuhui Zhou、Zhe Su、Tiwalayo Eisape、Hyunwoo Kim、Maarten SAPとの社会的相互作用をシミュレートする誤解を招く成功。 [ABS]、2024.03
Evoagent:進化的アルゴリズムSiyu Yuan、Kaitao Song、Jiangjie Chen、Xu Tan、Dongsheng Li、Deqing Yangを介した自動マルチエージェント生成に向けて。 [abs]、2024.06
Hollmwood:ロールプレイを介した脚本における大規模な言語モデルの創造性を解き放つJing Chen、Xinyu Zhu、Cheng Yang、Chufan Shi、Yadong Xi、Yuxiang Zhang、Junjie Wang、江PU、Rongsheng Zhang、Yujiu Yang、Tian Feng 、 2024.06
MATHVC:数学教育用のLLMシミュレーションマルチキャラクター仮想教室Murong Yue、Wijdane Mifdal、Yixuan Zhang、Jennifer Suh、Ziyu Yao。 [AB]、2024.4
人工レヴァイアサン:ホッブズの社会契約理論のレンズを通してLLMエージェントの社会的進化を探るゴードン・ダイ、ワイジア・チャン、ジンハン・リー、シキヤ・ヤン、チャイデラ・オノチー・LBE、スリハス・ラオ、アーサー・カタノ、ミシャ・SRA。 [abs]、2024.06
対話アクショントークン:マルチターンプランナーのケネス・リー、イミング・ワン、フェルナンダ・ヴィーガス、マーティン・ワッテンベルクとの目標指向の対話のステアリング言語モデル。 [abs]、2024.06
LLMディスカッション:ディスカッションフレームワークとロールプレイLi-Chun Lu、Shou-Jen Chen、Tsung-Min Pai、Chan-Hung Yu、Hung-Yi Lee、Shao-Hua Sun。 [ABS]、Colm 2024
マルチエージェントLLMコラボレーションにおけるペルソナの不適合:適合性、連絡、およびなりすましラザンバルタジ、ババクヘンマチアン、ラブR.バーシュニー。 [abs]、2024.05
マルチ専用のプロンプトは、大規模な言語モデルの信頼性、安全性、および有用性を向上させる
Do Xuan Long、Duong Ngoc Yen、Anh Tuan Luu、Kenji Kawaguchi、Min-Yen Kan、Nancy F. Chen。 [AB]、2024.11、EMNLP 2024。
大規模な言語モデルの性格特性
ムスタファ・サフダリ、グレッグ・セラピオ・ガルシア、クレメント・クレーピー、スティーブン・フィッツ、ピーター・ロメロ、ルーニング・サン、マルワ・アブドゥルハイ、アレクサンドラ・ファウスト、マジャ・マタリッチ。 [abs]、2023.7
ホワイトボックス言語モデルの性格の推定。
サケ・レディ・カラ、息子のン・グエン、ジャ・トゥラバンドゥーラ。 [AB]、2022.4
PersonAllm:性格特性と性差を表現するGPT-3.5の能力を調査する。
ハング・ジャン、Xiajie Zhang、Xubo Cao、Jad Kabbara。 、[abs]、2023.5
GPT-3は精神障害を示していますか?心理的な観点から大きな言語モデルを評価します。
Xingxuan Li、Yutong Li、Shafiq Joty、Linlin Liu、Fei Huang、Lin Qiu、Lidong Bing。 [abs]、2022.12
事前に訓練された言語モデルにおける性格の評価と誘導。広東江、マンジーXu、ソングチュンズー、ウェンジュアンハン、チーチャン、Yixin Zhu。 [AB]、2022.6
大手言語モデルでの心理学的尺度の信頼性を再検討します(以前:chatgpt an enfj、bard an istj:大規模な言語モデルの性格に関する経験的研究。) Jen-tse Huang、Wenxuan Wang、Man Ho Lam、Eric John Li、Wenxiang Jiao、マイケル・R・リュウ。 [abs]、2023.5
LLMSは個性を持っていますか? MBTIテストを大規模な言語モデルの驚くべき評価にします。
キーーパン、ヤウェン・ゼン。 [abs]、2023.7
ChatGptは人間の性格を評価できますか?一般的な評価フレームワーク。
Haocong Rao、Cyril Leung、Chunyan Miao。 [abs]、2023.3
GPT-3は誰ですか?人格、価値観、人口統計の探求。
マリル・ミオット、ニコラ・ロスバーグ、ベネット・クラインバーグ。 、[abs]、2022.9
LLMSの個性の編集
Shengyu Mao、Ningyu Zhang、Xiaohan Wang、Mengru Wang、Yunzhi Yao、Yong Jiang、Pengjun Xie、Fei Huang、Huajun Chen。 、[abs]、2023.10
映画スクリプトを使用した架空のキャラクターのMBTIパーソナリティ予測
Yisi Sang、Xiangyang Mou、Mo Yu、Dakuo Wang、Jing Li、Jeffrey Stanton。 、[abs]、emnlp 2022
大規模な言語モデルでの認知相乗効果を解き放つ:マルチパーソナの自己コラボレーションによるタスク解決エージェント
Zhenhailong Wang、Shaoguang Mao、Wenshan Wu、Tao Ge、Furu Wei、Heng Ji。 、[abs]、2023.7
オープンモデル、閉じた心?オープンな大きな言語モデルを通して人間の性格を模倣するエージェントの能力について
Lucio La Cava、Davide Costa、Andrea Tagarelli。 、[abs]、2024.01
1,000人のジュンソンパーク、キャロリンQ.ゾウ、アーロンショー、ベンジャミンマコヒル、キャリーカイ、メレディスリンゲルモリス、ロブウィラー、パーシーリアン、マイケルS.バーンスタインの生成エージェントシミュレーション。 [AB]、2024.11
心の理論は大きな言語モデルで自発的に出現したかもしれません
ミカル・コシンスキー。 [abs]、2023.2
ソトピア:言語エージェントにおける社会的知能のインタラクティブな評価
Xuhui Zhou、Hao Zhu、Leena Mathur、Ruohong Zhang、Haofei Yu、Zhengyang Qi、Louis-Philippe Morency、Yonatan Bisk、Daniel Fried、Graham Neubig、Maarten Sap。 [abs]、2023.10
Sotopia-π:社会的にインテリジェントな言語エージェントのインタラクティブな学習
Ruiyi Wang、Haofei Yu、Wenxin Zhang、Zhengyang Qi、Maarten Sap、Graham Neubig、Yonatan Bisk、Hao Zhu。 [ABS]、2024.03
Agentsense:インタラクティブなシナリオを通じて言語エージェントのソーシャルインテリジェンスのベンチマークXinyi Mou、Jingcong Liang、Jiayu Lin、Xinnong Zhang、Xiawei Liu、Shiyue Yang、Rong Ye、Lei Chen、Haoyu Kuang、Xuanjing Huang、Zhongyu wei [abs]、2024.10
アクションレベルの言語エージェントのソーシャルインテリジェンスの客観的なベンチマークに向けて、 Chenxu Wang、Bin Dai、Huaping Liu、Baoyuan Wangでのベンチマーク。 [AB]、2024.04
Opentom:大規模な言語モデルの理論理論的推論機能を評価するための包括的なベンチマーク。 Hainiu Xu、Runcong Zhao、Lixing Zhu、Jinhua du、Yulan He。 [AB]、2024.02。
これは実生活ですか?これはただのファンタジーですか? LLMS Xuhui Zhou、Zhe Su、Tiwalayo Eisape、Hyunwoo Kim、Maarten Sap [abs]、2024.03との社会的相互作用をシミュレートする誤解を招く成功
大規模な言語モデルでのロールプレイMurray Shanahan、Kyle McDonell、およびLaria Reynolds。 [abs]、2023.5
人工知能の意識:意識の科学からの洞察。パトリック・ブトリン、ロバート・ロング、エリック・エルモズニーノ、ヨシュア・ベンギオ、ジョナサン・バーチ、アクセル・コンスタント、ジョージ・ディーン、スティーブン・M・フレミング、クリス・フリス、xu ji、リョタ・カナイ、コリン・クレイン、グレース・リンゼイ、マティアス・ミシェル、 、エリック・シュヴィッツゲベル、ジョナサンサイモン、ルフィン・ヴァンルレン。 [abs]、2023.8
ChatGptの自己認識と政治的偏見。
JérômeRutinowski、Sven Franke、Jan Endendyk、Ina Dormuth、Markus Pauly。 、2023.4。タグ:人格特性、政治的偏見、暗い人格特性。
会話型AIの政治的イデオロギー:ChatGPTの環境環境、左リバタリアン志向に関する収束証拠。
Jochen Hartmann、Jasper Schwenzow、Maximilian Witte。 、2023.1。タグ:政治的偏見。
大規模な言語モデルに不安を誘発すると、探索とバイアスが増加します。
ジュリアン・コーダ・フォルノ、クリスティン・ウィッテ、アクシャイ・K・ジャガディッシュ、マルセル・ビンツ、ゼイネップ・アカタ、エリック・シュルツ。 、2023.4。タグ:不安。
LLMエージェントのコラボレーションメカニズムの調査:社会心理学の見解。
Jintian Zhang、Xin Xu、shumin deng。 、2023.10。タグ:社会心理学。
rpbenchリーダーボードBoson ai。 [リーダーボード]
Higgs-llama-3-70bボソンAI。 [Huggingface]
[character.ai赛道的真相(キャラクターのトラックに関する真実)] 、2024.08
[李沐:创业一年:创业一年、人间三年!(Mu Li(Boson AI):起業家精神の1年、人間の世界で3年!)] 、2024.08
[ACL 2024角色扮演方向都发了啥(ACL 2024でのロールプレイング方向への出版物のレビュー)] 、2024.07
[角色扮演大模型的碎碎念(ロールプレイングのための大規模な言語モデルのとりとめ)] 、2024.03
[聊一聊做角色扮演大模型的经验(ロールプレイングの大規模な言語モデルの開発における経験について議論)] 、2024.10
[角色扮演大模型技术分享(ロールプレイングの大規模な言語モデルに関する技術的な洞察)] 、2024.03
[角色扮演大模型技术分享2-超拟人模型的困境(ロールプレイングの大規模な言語モデルに関する技術的な洞察2-超人類モデルのジレンマ)] 、2024.09
[角色扮演大模型技术分享3-拟人能力提升&数据合成パイプライン(ロールプレイの大規模な言語モデルの技術的洞察3-擬人化機能とデータ合成パイプラインの改善)] 、2024.09
1,000ペア:ロングコンテキスト言語モデルの「斬新な」課題Marzena Karpinska、Katherine Thai、Kyle Lo、Tanya Goyal、Mohit Iyyer。 [abs]、2024.06
Novelqa:ベンチマーク質問200kトークンを超えるドキュメントでの回答Cunxiang Wang、Ruoxi Ning、Boqi Pan、Tonghui Wu、Qipeng Guo、Cheng Deng、Guangsheng Bao、Xiangkun Hu、Zheng Zhang、Qian Wang、Yue Zhang。 [ABS]、2024.03
ビジュアルロールプレイ:ロールプレイングイメージキャラクターSiyuan MA、Weidi Luo、Yu Wang、Xiaogeng Liuを介したマルチモーダル大手言語モデルに対するユニバーサルジェイルブレイク攻撃。 [abs]、2024.06
AI猫のナレーター:猫のZhenchi Lai、Janet Yi-Ching Huang、Rung-Huei Liangとの共有世界と社会的つながりを探るためのAIツールの設計。 [abs]、2024.06
Theanine:タイムラインの高級応答生成との長期的な会話でメモリ管理を再検討しますSeo Hyun Kim、Kai Tzu-Iunn Ong、Taeyoon Kwon、Namyoung Kim、Keummin KA、Seonghyeon Bae、Yohan Jo、Seung-Won Hwang、Dongha Leeヨ。 [abs]、2024.06
ESC-EVAL:大規模な言語モデルでの感情サポートの会話の評価Haiquan Zhao、Lingyu Li、Shisong Chen、Shuqi Kong、Jiaan Wang、Kexin Huang、Tianle Gu、Yixu Wang、Dandan Liang、Zhixu Li、Yan Teng、Yanghua Xio、Yingchunwan 。 [abs]、2024.06
患者 - ψ:メンタルヘルスの専門家を訓練するために患者をシミュレートするために大規模な言語モデルを使用して、Ruiyi Wang、Stephanie Milani、Jamie C. Chiu、Jiayin Zhi、Shaun M. Eack、Travis Labrum、Samuel M. Murphy、Nev Jones、Kate Hardy、Hongシェン、フェイ・ファン、zhiyuゾーイ・チェン。 [abs]、2024.05
CharacterMeet:LLM駆動のチャットボットアバターとの会話を通じて、クリエイティブライターのストーリー全体の構成プロセスをサポート*Hua Xuan Qin、Shan Jin、Ze Gao、Minging Fan、Pan Hui。 [ABS]、Chi 2024。
ステファニー:社会的会話で人間の相互作用を模倣するための段階的な対話ハオ・ヤン、香港・ルー、Xinhua Zeng、Yang Liu、Xiang Zhang、Haoran Yang、Yumeng Zhang、Yiran Wei、Wai Lam。 [abs]、2024.07
?