? Coala : 멋진 언어 에이전트

언어 에이전트 (? Coala) 프레임 워크의인지 구조를 사용한 언어 에이전트의 편집.
- Coala Paper (주요 콘텐츠의 16 페이지) : https://arxiv.org/abs/2309.02427
- Coala Tweet (6 스레드) : https://twitter.com/shunyuyao12/status/1699396834983362690
- 300 개 이상의 관련 인용이있는 Coala Bibtex 파일 : Coala.bib
- Coala Bibtex 인용 당사의 작업/자원이 유용하다고 생각하는 경우 :
@misc { sumers2023cognitive ,
title = { Cognitive Architectures for Language Agents } ,
author = { Theodore Sumers and Shunyu Yao and Karthik Narasimhan and Thomas L. Griffiths } ,
year = { 2023 } ,
eprint = { 2309.02427 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.AI }
}? Coala 개요
Coala는 액션 공간 으로 시작하여 언어 에이전트를 깔끔하게 지정하며, 여기에는 두 부분이 있습니다.
- 외부 환경과 상호 작용하는 외부 조치 ( 접지 )
- 내부 기억과 상호 작용하기위한 내부 조치 ( 추론 , 검색 , 학습 )
- 언어 에이전트는 단기 작업 메모리와 여러 (선택적) 장기 기억을 가지고 있습니다 (경험을위한 에피소드, 지식을위한 시맨틱, 코드/LLM)
- 추론 = 작업 메모리 업데이트 (LLM 포함)
- 검색 = 장기 기억을 읽습니다
- 학습 = 장기 기억을 쓰십시오

그렇다면 언어 에이전트는 어떤 행동을 취할 행동을 선택합니까? 그 행동은 의사 결정 주기로 구성되며 각주기에는 두 단계가 있습니다.
- 계획 : 대리인은 추론/검색 조치를 (반복적으로) 행동 제안 및 평가 한 다음 학습/접지 행동을 선택합니다.
- 실행 : 선택된 학습/접지 행동은 내부 메모리 또는 외부 세계에 영향을 미치기 위해 실행됩니다.

더 이해하려면 논문의 섹션 4를 읽으십시오.
서류
아래는 Coala.bib Plus Pulled 요청에서 스크랩 된 서브 세트 중 하나 일 뿐이며 잠재적으로 잘못된 작업 공간 레이블이 있습니다. 날짜는 arxiv v1을 기준으로합니다. 그들은 모든 언어 에이전트 작업을 대표하지는 않으며, 곧 더 많은 작업을 추가 할 계획이며 (풀 요청 환영), 인용 된 작업에 대한 레이블이 있습니다.
- (2021-10) AI 사슬 : 대형 언어 모델 프롬프트를 체인하여 투명하고 제어 가능한 인간 -AI 상호 작용 (추론)
- (2021-10) SILG : 다중 환경 상징적 인 대화식 언어 접지 벤치 마크 (환경)
- (2022-01) 제로 샷 플래너로서의 언어 모델 : 구체화 된 에이전트를위한 실행 가능한 지식 추출 (접지)
- (2022-03) Promptchainer : 시각적 프로그래밍을 통한 대형 언어 모델 프롬프트 (접지)
- (2022-03) Scienceworld : 대리인이 5 학년보다 똑똑합니까? (환경)
- (2022-04) 내가 말한대로 할 수있는대로 : 로봇 계약의 언어 접지 (접지)
- (2022-04) 소크라테스 모델 : 언어로 제로 샷 멀티 모달 추론 구성 (접지)
- (2022-07) Webshop : 기반 언어 에이전트와의 확장 가능한 실제 웹 상호 작용 (환경)
- (2022-09) ProgPrompt : 대형 언어 모델을 사용하여 위치한 로봇 작업 계획을 생성 (접지)
- (2022-10) 분해 된 프롬프트 : 복잡한 작업을 해결하기위한 모듈 식 접근법 (추론)
- (2022-10) 마인드의 눈 : 시뮬레이션을 통한 접지 언어 모델 추론 (접지)
- (2022-10) 반응 : 언어 모델에서의 시너지 효과 및 행동 (접지, 추론)
- (2022-11) 대형 언어 모델은 인간 수준의 프롬프트 엔지니어입니다 (추론)
- (2022-12) LLM-PLANNER : 대형 언어 모델을 갖는 구체화 된 에이전트에 대한 소수의 기반 계획 (접지)
- (2022-12) 생성하지 말고 차별 : 실제 환경에 언어 모델을 접지하는 제안 (접지)
- (2023-02) 후시 체인은 언어 모델을 피드백 (학습)으로 정렬합니다.
- (2023-02) 설명, 설명, 계획 및 선택 : 대형 언어 모델을 사용한 대화식 계획 오픈 월드 멀티 태스킹 에이전트 (접지, 추론)가 가능합니다.
- (2023-02) 도구 형식 : 언어 모델은 도구 (접지)를 사용하도록 가르 칠 수 있습니다.
- (2023-03) 의사 결정을위한 기초 모델 : 문제, 방법 및 기회 (설문 조사)
- (2023-03) HuggingGpt : 포옹 페이스에서 Chatgpt 및 친구들과 AI 작업을 해결 (접지)
- (2023-03) Palm-e : 구현 된 멀티 모달 언어 모델 (접지)
- (2023-03) 반사 : 언어 강화 학습을 가진 언어 에이전트 (접지, 추론, 학습)
- (2023-03) 자기 반주 : 자기 피드백을 통한 반복적 인 개선 (추론)
- (2023-03) 큰 언어 모델을 가진 자체 계획 코드 생성 (추론)
- (2023-04) 생성제 : 인간 행동의 대화식 시뮬 라 크라 (접지, 추론, 검색, 학습)
- (2023-04) 대형 언어 모델의 출현 자율 과학 연구 능력 (접지, 추론)
- (2023-04) LLM+P : 최적의 계획 능력을 갖춘 대형 언어 모델 강화 (접지, 추론)
- (2023-04) 정유 자 : 중간 표현에 대한 추론 피드백 (추론)
- (2023-04) 대형 언어 모델 교육 자체 곤란 (추론)
- (2023-04) Genegpt : 생의학 정보에 대한 액세스를 향상시키기위한 도메인 도구로 대형 언어 모델을 늘리기 (접지, 추론)
- (2023-05) 비평가 : 대형 언어 모델은 공구 인터랙티브 비평 (접지, 추론, 검색)으로 자체적으로 수정할 수 있습니다.
- (2023-05) 대형 언어 모델을 가진자가 에이전트 증강 (접지, 추론, 검색, 학습)
- (2023-05) chatcot : 채팅 기반의 대형 언어 모델에 대한 도구를 구입 한 추론 (접지, 추론)
- (2023-05) ToolKengpt : 도구 임베딩을 통한 대규모 도구로 냉동 언어 모델을 늘리십시오 (접지, 추론)
- (2023-05) 분해는 자기 평가 가이드 디코딩을 통한 추론을 향상시킵니다 (추론)
- (2023-05) 다중 에이전트 토론을 통해 큰 언어 모델에서의 다양한 사고를 장려 (근거, 추론)
- (2023-05) 다중 기관 토론을 통한 언어 모델의 사실과 추론 개선 (근거, 추론)
- (2023-05) Adaplanner : 언어 모델을 사용한 피드백의 적응 계획 (접지, 검색, 학습)
- (2023-05) Plan and-Solve Prompting : 대형 언어 모델에 의한 제로 샷 사슬의 추론 개선 (추론)
- (2023-05) Rewoo : 효율적인 증강 언어 모델에 대한 관찰에서 분리되는 추론 (접지, 추론)
- (2023-05) Swiftsage : 복잡한 대화식 작업에 대한 빠르고 느린 생각을 가진 생식기 (접지, 추론)
- (2023-05) 생각의 나무 : 큰 언어 모델로 고의적 인 문제 해결 (추론)
- (2023-05) Voyager : 대형 언어 모델을 가진 개방형 구체 에이전트 (접지, 추론, 검색, 학습)
- (2023-06) Intercode : 실행 피드백을 사용한 대화식 코딩 표준화 및 벤치마킹 (접지, 추론)
- (2023-06) ToolQa : LLM 질문을위한 데이터 세트 외부 도구로 답변 (접지)
- (2023-06) Mind2Web : 웹 일반 대리인을 향하여 (환경)
- (2023-06) Restgpt : 대형 언어 모델을 실제 RESTFUL API (접지, 추론) 연결
- (2023-06) Toolalpaca : 3000 건의 시뮬레이션 된 사례가있는 언어 모델에 대한 일반화 된 도구 학습 (접지, 추론)
- (2023-07) 계획, 긴 맥락 이해 및 프로그램 합성이있는 실제 웹 에이전트 (접지, 추론)
- (2023-07) RT-2 : Vision-Language-Action 모델은 웹 지식을 로봇 제어 (접지)로 전송합니다.
- (2023-07) Roco : 대형 언어 모델과의 변증 법적 다중 로봇 협력 (접지)
- (2023-07) 도움을 요청하는 로봇 : 대형 언어 모델 플래너에 대한 불확실성 정렬 (접지)
- (2023-07) S $^3 $ : 대형 언어 모델에 대한 대리인이있는 소셜 네트워크 시뮬레이션 시스템 (접지, 추론)
- (2023-07) TOOLLLM : 16000+ 실제 API를 마스터하기 위해 대형 언어 모델을 촉진합니다 (접지, 추론, 검색)
- (2023-07) 정신적 복지 지원을 위해 대형 언어 모델 기반 대화 에이전트를 사용하는 이점과 과제 이해 (접지)
- (2023-07) 대형 언어 모델에서의인지 시너지 효과 : 다중 페인즈 자체 청소기 (접지, 추론)를 통한 작업 해결 에이전트
- (2023-07) Webarena : 자율 에이전트 구축을위한 현실적인 웹 환경 (환경)
- (2023-08) 에이전트 벤치 : 에이전트로서 LLM을 평가 (환경)
- (2023-08) Agentverse : 다중 에이전트 협력 촉진 및 에이전트의 출현 행동 탐색 (환경)
- (2023-08) Autogen : 다중 에이전트 대화 프레임 워크를 통해 차세대 LLM 응용 프로그램 활성화 (접지, 추론)
- (2023-08) CGMI : 구성 가능한 일반 다중 에이전트 상호 작용 프레임 워크 (접지, 추론)
- (2023-08) Chateval : 다중 에이전트 토론을 통한 더 나은 LLM 기반 평가자를 향해 (접지, 추론)
- (2023-08) 큰 언어 모델을 가진 누적 추론 (추론)
- (2023-08) Expel : LLM 에이전트는 체험 학습자입니다 (접지, 추론, 검색, 학습)
- (2023-08) GPT-in-the-Loop : 다중 기관 시스템에 대한 적응 적 의사 결정 (접지, 추론)
- (2023-08) Gentopia : 도구를 사용하는 LLM (환경)을위한 공동 작업 플랫폼 (환경)
- (2023-08) Metagpt : 다중 에이전트 공동 작업 프레임 워크를위한 메타 프로그래밍 (접지, 추론)
- (2023-08) Proagent : 대형 언어 모델을 갖춘 사전 사전 협력 AI 구축 (접지, 추론)
- (2023-08) Retroformer : 정책 기울기 최적화를 가진 회고 적 대형 언어 에이전트 (접지, 추론, 학습)
- (2023-08) Sapien : 대형 언어 모델에 의해 구동되는 정서적 가상 에이전트 (접지, 추론)
- (2023-08) 강력한 AI를위한 대형 언어 모델 및인지 구조의 상승적 통합 : 탐색 적 분석 (접지, 추론, 검색, 학습)
- (2023-09) Tora : 수학적 문제 해결을위한 도구 통합 추론 (접지, 추론, 학습)
- (2023-09) LM에 해당 샌드 박스를 갖는 LM 에이전트의 위험을 식별 (환경)
- (2023-09) 의심 에이전트 : 마음의 이론 인식 GPT-4 (접지, 추론)와 함께 불완전한 정보 게임 재생
- (2024-01) 자제력 : 일관되지 않은 해결 관점을 통한 더 나은 반사 (추론, 반사)
- (2024-02) Agent-Pro : 정책 수준의 반영 및 최적화를 통해 진화하는 법 (추론, 성찰, 학습)
- (2024-03) LLM3 : 모션 실패 추론을 가진 대형 언어 모델 기반 작업 및 모션 계획. (계획, 추론)
- (2024-04) AI 에이전트와의 생물 의학적 발견에 힘을 실어주십시오 (AI 과학자, 생의학 연구)
- (2024-05) Timechara : 대형 언어 모델의 롤링 캐릭터 환각 평가 (추론, 검색)
(곧 추가 될 예정입니다. 요청을 당기십시오.)
자원
- LLM 전원 자율 에이전트 (Lil'Log)
- LLM-Agents-Papers
- llmagentPapers
- 굉장한 선거구 에이전트
(곧 추가 될 예정입니다. 요청을 당기십시오.)