? Коала: Потрясающие языковые агенты

Компиляция языковых агентов, использующих когнитивные архитектуры для языковых агентов (? Коала) .
- Угарная бумага (16 страниц основного содержания): https://arxiv.org/abs/2309.02427
- Твит Cala (6 потоков): https://twitter.com/shunyuyao12/status/1699396834983362690
- Файл Bibtex Coala с более чем 300 связанными цитатами: Cala.bib
- Coala Bibtex Citation, если вы найдете нашу работу/ресурсы полезной:
@misc { sumers2023cognitive ,
title = { Cognitive Architectures for Language Agents } ,
author = { Theodore Sumers and Shunyu Yao and Karthik Narasimhan and Thomas L. Griffiths } ,
year = { 2023 } ,
eprint = { 2309.02427 } ,
archivePrefix = { arXiv } ,
primaryClass = { cs.AI }
}? Обзор Cala
Коала аккуратно указывает языкового агента, начиная с его пространства действий , в котором есть 2 части:
- Внешние действия для взаимодействия с внешними средами ( заземление )
- Внутренние действия по взаимодействию с внутренними воспоминаниями ( рассуждения , поиск , обучение )
- Языковой агент имеет кратковременную рабочую память и несколько (необязательных) долгосрочных воспоминаний (эпизодические для опыта, семантика для знаний, процедурная для кода/LLM)
- Рассуждение = Обновление рабочей памяти (с LLM)
- Поиск = прочитать долговременную память
- Learning = написать долговременную память

Тогда как языковой агент выбирает, какое действие предпринять? Его действия структурированы в циклах принятия решений , и каждый цикл имеет два этапа:
- Планирование : агент применяет действия по рассуждениям/поиску (итеративно) предложить и оценить действия, а затем выберите действие обучения/заземления.
- Выполнение : Выбранное действие обучения/заземления выполняется, чтобы повлиять на внутреннюю память или внешний мир.

Чтобы понять больше, прочитайте раздел 4 нашей статьи.
Документы
Ниже приведен только подмножество бумаг, соскобающих из Coala.bib Plus, вытянутые запросы, с потенциально неверными метками пространства действий. Дата основана на arxiv v1. Они не представляют всю работу с агентом по языку, и мы планируем добавить больше работы в ближайшее время (приглашать запросы) и иметь ярлыки для высокопроизводительной работы.
- (2021-10) Цепочки AI: прозрачное и контролируемое взаимодействие человека с аи-аи
- (2021-10) Сильг: Символический интерактивный языковой языковой контроль с множественным средством окружающей среды (окружающая среда)
- (2022-01) Языковые модели как планировщики с нулевым выстрелом: извлечение действенных знаний для воплощенных агентов (заземление)
- (2022-03) Приглашение: цеповать
- (2022-03) ScienceWorld: Ваш агент умнее 5-го класса? (среда)
- (2022-04) Сделайте так, как я могу, а не как я говорю: основание в роботизированных возможностях (основание)
- (2022-04) Сократические модели: составление мультимодальных рассуждений с нулевым выстрелом с языком (обоснование)
- (2022-07) Веб-магазин: на пути к масштабируемому реальному веб-взаимодействию с заземленными языковыми агентами (среда)
- (2022-09) Progprompt: генерирование планов задач робота с использованием моделей крупных языков (заземление)
- (2022-10) Разлагаемое подсказка: модульный подход для решения сложных задач (рассуждения)
- (2022-10) Mind's Eye: обоснование модели на основе языка посредством симуляции (заземление)
- (2022-10) React: синергирование рассуждений и действий в языковых моделях (обоснование, рассуждение)
- (2022-11) Большие языковые модели являются инженерами-инженерами на уровне человека (рассуждения)
- (2022-12) LLM-Planner: несколько выстрела заземленного планирования для воплощенных агентов с большими языковыми моделями (заземление)
- (2022-12) Не генерируйте, дискриминация: предложение о основании языковых моделей в реальных средах (заземление)
- (2023-02) Цепочка задним числом выравнивает языковые модели с обратной связью (Learning)
- (2023-02) Опишите, объясните, планируйте и выберите: интерактивное планирование с большими языковыми моделями позволяет многозагововать открытое мир (заземление, рассуждения)
- (2023-02) Toolformer: Языковые модели могут научить себя использовать инструменты (заземление)
- (2023-03) Фонд модели для принятия решений: проблемы, методы и возможности (Обзор)
- (2023-03) HuggingGpt: решение задач AI с Chatgpt и его друзьями в обнимании лица (заземление)
- (2023-03) Palm-E: модель воплощенного мультимодального языка (заземление)
- (2023-03) Рефлексия: Языковые агенты с устным обучением подкрепления (обоснование, рассуждение, обучение)
- (2023-03) Саморефина: итеративная уточнение с помощью самоотдачи (рассуждения)
- (2023-03) Генерация самопланирования кода с большими языковыми моделями (рассуждения)
- (2023-04) Генеративные агенты: интерактивная симулякра человеческого поведения (обоснование, рассуждение, поиск, обучение)
- (2023-04) Эффективные автономные научные научные исследования моделей крупных языков (обоснование, рассуждение)
- (2023-04) LLM+P: расширение возможностей крупных языковых моделей с оптимальным мастерством планирования (обоснование, рассуждение)
- (2023-04) Распространение: рассуждение отзывы о промежуточных представлениях (рассуждения)
- (2023-04) Обучение большим языковым моделям для самооборота (рассуждения)
- (2023-04) Genegpt: увеличение больших языковых моделей с помощью доменных инструментов для улучшения доступа к биомедицинской информации (обоснование, рассуждение)
- (2023-05) Критик: Модели больших языков могут самоправнуть с помощью инструмента-интерактивного критики (обоснование, рассуждение, поиск)
- (2023-05) Увеличение автотелельных агентов с большими языковыми моделями (обоснование, рассуждение, поиск, обучение)
- (2023-05) Чаткот: сфера деятельности по цепочке размышлений о больших языковых моделях, основанных на чате (обоснование, рассуждение)
- (2023-05) Toolkengpt: расширение моделей замороженных языков с помощью массивных инструментов с помощью инструментов Entricdings (заземление, рассуждения)
- (2023-05) Разложение усиливает рассуждения за счет декодирования самооценки (рассуждения)
- (2023-05) Поощрение расходящегося мышления в крупных языковых моделях с помощью многоагентных дебатов (обоснование, рассуждения)
- (2023-05) Улучшение фактической и рассуждения в языковых моделях с помощью многоагентных дебатов (обоснование, рассуждения)
- (2023-05) Adaplanner: адаптивное планирование от обратной связи с языковыми моделями (заземление, поиск, обучение)
- (2023-05) Подсказки о плане и выставке: улучшение с нулевой цепочкой размышлений с помощью крупных языковых моделей (рассуждения)
- (2023-05) Rewoo: отделение рассуждений от наблюдений за эффективными моделями дополненного языка (обоснование, рассуждения)
- (2023-05) Swiftsage: генеративный агент с быстрым и медленным мышлением для сложных интерактивных задач (заземление, рассуждение)
- (2023-05) Дерево мыслей: преднамеренное решение проблем с большими языковыми моделями (рассуждения)
- (2023-05) Voyager: открытый воплощенный агент с большими языковыми моделями (обоснование, рассуждение, поиск, обучение)
- (2023-06) Межкод: стандартизация и сравнительный анализ интерактивного кодирования с обратной связью выполнения (заземление, рассуждение)
- (2023-06) Toolqa: набор данных для вопросов LLM, отвечающий на внешние инструменты (заземление)
- (2023-06) Mind2web: к генеральному агенту для Интернета (среда)
- (2023-06) RESTGPT: Соединение больших языковых моделей с реальными RESTFUL API (заземление, рассуждение)
- (2023-06) Toolalpaca: Обобщенное обучение инструмента
- (2023-07) Реальный вебагент с планированием, длинным контекстом и синтезом программы (обоснование, рассуждение)
- (2023-07) RT-2: модели зрительного языка-боевые модели передают веб-знания на роботизированное управление (заземление)
- (2023-07) Roco: диалектическое сотрудничество с несколькими роботами с большими языковыми моделями (заземление)
- (2023-07) Роботы, которые просят о помощи: выравнивание неопределенности для планировщиков моделей крупных языков (заземление)
- (2023-07) S $^3 $: Система моделирования социальных сетей с крупными языковыми агентами, обеспечивающими модель (заземление, рассуждение)
- (2023-07) TOOLLLM: Облегчение больших языковых моделей для освоения API-интерфейсов реального мира 16000+ (обоснование, рассуждения, поиск)
- (2023-07) Понимание преимуществ и проблем использования крупных языковых модельных агентов для поддержки психического благополучия (Основа)
- (2023-07) Развязывать когнитивную синергию в крупных языковых моделях: агент по решению задач с помощью мультиполичной самостоятельной работы (обоснование, рассуждения)
- (2023-07) Webarena: реалистичная веб-среда для создания автономных агентов (среда)
- (2023-08) Agentbench: оценка LLMS как агентов (окружающая среда)
- (2023-08) Agentverse: облегчение многоагентного сотрудничества и изучение возникающего поведения у агентов (окружающая среда)
- (2023-08) Autogen: Включение приложений LLM следующего поколения через многоагентную структуру разговора (заземление, рассуждения)
- (2023-08) CGMI: настраиваемая общая структура многоагентного взаимодействия (заземление, рассуждение)
- (2023-08) Chateval: к лучшим оценщикам на основе LLM посредством многоагентных дебатов (обоснование, рассуждения)
- (2023-08) Совокупные рассуждения с большими языковыми моделями (рассуждения)
- (2023-08) Экспентерии: Агенты LLM являются опытными учащимися (основание, рассуждение, поиск, обучение)
- (2023-08) GPT-in-the-the: адаптивное принятие решений для многоагентных систем (заземление, рассуждения)
- (2023-08) Глопия: совместная платформа для LLMS с инструментами (среда)
- (2023-08) Метагпт: метапрограммирование для многоагентных совместных рамок (заземление, рассуждение)
- (2023-08) Проагаент: строительство проактивного кооперативного искусственного интеллекта с большими языковыми моделями (обоснование, рассуждения)
- (2023-08) Мощный ретроформир: ретроспективные крупные языковые агенты с оптимизацией градиента политики (обоснование, рассуждение, обучение)
- (2023-08) Sapien: аффективные виртуальные агенты, основанные на крупных языковых моделях (обоснование, рассуждение)
- (2023-08) Синергетическая интеграция крупных языковых моделей и когнитивных архитектур для надежного ИИ: исследовательский анализ (обоснование, рассуждение, поиск, обучение)
- (2023-09) Тора: Интегрированный инструмент агент по рассуждению для решения математических проблем (обоснование, рассуждение, обучение)
- (2023-09) Определение рисков агентов LM с помощью LM-врученной песочницы (окружающая среда)
- (2023-09).
- (2024-01). Самоуконтрастные: лучшее размышление посредством непоследовательных перспектив решения (рассуждение, размышление)
- (2024-02) Agent-Pro: Learning для развития посредством размышлений и оптимизации на уровне политики (рассуждение, размышление, обучение)
- (2024-03) LLM3: на основе задач и планирования движения на основе моделей на основе модели и движения. (планирование, рассуждение)
- (2024-04) Расширение прав и возможностей биомедицинских открытий с агентами ИИ (Ученый ИИ, Биомедицинские исследования)
- (2024-05) TimeChara: оценка галлюцинации персонажей на временном времени в ролевых моделях крупных языков (рассуждение, поиск)
(Подробнее будет добавлено.
Ресурсы
- Автономные агенты LLM (Lil'log)
- LLM-Agents-Papers
- Llmagentpapers
- Awesome-llm-активность
(Подробнее будет добавлено.