Потрясающая самосогласованность LLM: куратор самосогласованность в крупных языковых моделях
Этот репозиторий, называемый самосогласованностью LLMS , содержит набор ресурсов и документов о самосогласованности в крупных языковых моделях .
« Я не вижу пути, который гарантирует безопасность. Мы вступаем в период большой неопределенности, когда мы имеем дело с вещами, с которыми мы никогда не сталкивались раньше, и мы не можем позволить себе ошибаться с этими вещами, потому что они могут взять на себя». - Джеффри Хинтон, профессор, факультет компьютерных наук, Университет Торонто, 5 октября 2023 года.
Добро пожаловать, чтобы поделиться своими статьями, мыслями и идеями, отправив проблему!
Учить языковые модели рассуждения
Денни Чжоу, Google DeepMind
[Связь]
Сентябрь 2023 года
Путь к искусственному общему интеллекту: понимание диалога состязательного LLM
Эдвард Й. Чанг
Socrasynth.com, [ссылка]
Март 2024 г.
Фонд модели для обработки естественного языка: предварительно обученные языковые модели интегрируют медиа
Герхард Паас, Свен Гессельбах
Искусственный интеллект: основы, теория и алгоритмы (Springer Nature), [Link]
16 февраля 2023 года
GSM8K-согласованность :
Последовательность арифметических рассуждений на эталоне GSM8K
Shuyue Jia
Обнимая лицо 2023, [обнимаю лицо] [GitHub]
01 декабря 2023 года
GSM8K :
Обучение проверки для решения задач по математике
Карл Кобб, Винеет Косараджу, Мохаммад Баварар, Марк Чен, Хивоо Джун, Лукаш Кайзер, Матиас Плапперт, Джерри Творек, Джейкоб Хилтон, Рейхиро Накано, Кристофер Хессе, Джон Шулман
Arxiv 2021, [Paper] [GitHub] [Пост в блоге]
18 ноября 2021 года
Singleteq :
Проблемы с алгебраическим словом в уравнениях
Рик Консель-Кедзиорски, Ханнане Хаджиширзи, Ашиш Сабхарвал, Орен Эциони, Сиена Дюма Анг
Tacl 2015, [Paper] [Gitlab]
24 июня 2015 года
Addsub :
Обучение решению проблем арифметических слов с категоризацией глагола
Мохаммад Джавад Хоссейни, Ханнане Хаджиширзи, Орен Эциони, Нейт Кушман
EMNLP 2014, [Paper] [Gitlab]
25 октября 2014 года
Multiarith :
Решение проблем общих арифметических слов
Subhro Roy, Дэн Рот
EMNLP 2015, [Paper] [веб -страница]
17 сентября 2015 года
Aqua-Rat :
Индукция программы по генерации обоснования: обучение решению и объяснению проблем алгебраических слов
Ван Лин, Дани Йогатама, Крис Дайер, Фил Блунсом
ACL 2017, [Paper] [GitHub]
30 июля 2017 года
Svamp :
Действительно ли модели НЛП могут решать простые задачи по математическому слову?
Аркил Патель, Сатвик Бхаттамишра, Навин Гоял
NAACL 2021, [Paper] [GitHub]
6 июля 2021 года
Asdiv :
Разнообразный корпус для оценки и разработки английских решателей задач по математике
Шен-Юн Мяо, Чао-Чун Лян, Кех-Ю-Су Су
ACL 2020, [Paper] [GitHub]
5 июля 2020 года
CSQA :
Commonsenseqa: вопрос, отвечающий на проблему, нацеленная на знания здравого смысла
Алон Талмор, Джонатан Херциг, Николас Лур, Джонатан Берант
NAACL 2019, [Paper] [Веб -страница]
15 марта 2019 года
Бекил :
Becel: эталон для оценки согласованности языковых моделей
Myeongjun Jang, Deuk Sin Kwon, Thomas Lukasiewicz
Coling 2022, [Paper] [GitHub]
12 октября 2022 года
Перефразируемые вопросы отряда :
Улучшение надежности систем ответа вопросов для сомнения за сомнением перефразирования
Wee Chung Gan, Hwee Tou ng
ACL 2019, [Paper] [GitHub]
28 июля 2019 года
Бекил :
Becel: эталон для оценки согласованности языковых моделей
Myeongjun Jang, Deuk Sin Kwon, Thomas Lukasiewicz
Coling 2022, [Paper] [GitHub]
12 октября 2022 года
Два неудачи самосогласости в многоэтапных рассуждениях LLMS
Анжелика Чен, Джейсон Пханг, Алисия Парриш, Вишах Падмакумар, Чен Чжао, Сэмюэль Р. Боуман, Кюнхён Чо
Arxiv 2023, [Paper]
2 октября 2023 года
MPARAREL :
MPARAREL: Фактическая последовательность многоязычных моделей языка
Constanza Fierro, Anders Søgaard
Результаты ACL: ACL 2022, [Paper] [GitHub]
22 марта 2022 года
Парарель :
Парарель: Metal :: Измерение и улучшение последовательности в предварительно проведенных языковых моделях
Янай Элазар, Нора Касснер, Шаули Равфогель, Абхилаша Равичандер, Эдуард Хови, Хинрих Шютце, Йоав Голдберг
TACL 2021, [Paper] [GitHub] [Presentation]
29 мая 2021 года
Math-Sheperd: Проверьте и усилите LLMS шаг за шагом без аннотаций человека
Пейи Ван, Лей Ли, Чжихон Шао, Р.К. Сюй, Дамай Дай, Йифеи Ли, Дели Чен, Ю.Ву, Жифанг Суй
Arxiv 2023, [Paper]
28 декабря 2023 года
Обзор рассуждений с моделями фундамента
Цзянкай Сан, Чуаньян Чжэн, Энзе Си, Чженгинг Лю, Руханг Чу, Цзяньинг Цю, Цзяки Сюй, Минью Дин, Хонгьян Ли, Менгже Генг, Юэ Ву, Венхай Ванг, Джун Чен, Чжангью Иин, Синьозхэ, Жюнь -Хен, Жюнь, Жюнь Чен, У, Джун Хен, Жюнь Чен, Жюнь Чен, Жюнь Чен, Жюнь Чен. Лю, Сихуи Лю, Ю Ли, Хао Донг, Ю Ченг, Мин Чжан, Фенг Энн Хенг, Джифенг Дай, Пинг Луо, Цзиндон Ванг, Джи-Ронг Вэнь, Сюзенг Цю, Йике Го, Хуи Сионг, Кун Лю, Чжэнгуо
Arxiv 2023, [Paper] [GitHub]
26 декабря 2023 года
Увеличение запросов и реакции не может помочь в обобщении математических рассуждений.
Chengpeng Li, Zheng Yuan, Hongyi Yuan, Guanting Dong, Keming Lu, Jiancan Wu, Chuanqi Tan, Сян Ван, Чан Чжоу
Arxiv 2023, [Paper] [GitHub]
1 ноября 2023 года
Metamath: Bootstrap ваши собственные математические вопросы для больших языковых моделей
Longhui Yu, Weisen Jiang, Han Shi, Jincheng Yu, Zhenging Liu, Yu Zhang, James T. Kwok, Zhenguo Li, Adrian Weller, Weiyang Liu
Arxiv 2023, [Paper] [GitHub]
9 октября 2023 года
Большие языковые модели-это лучшие разумные с самого трансляции
Yixuan Weng, Minjun Zhu, Fei Xia, Bin Li, Shizhu He, Shenging Liu, Bin Sun, Kang Liu, Jun Zhao
EMNLP 2023 Результаты, [Paper] [GitHub]
19 октября 2023 года
Рассуждения с подсказкой языковой модели: опрос
Шуофей Цяо, Йисин Оу, Нинью Чжан, Сян Чен, Юньцхи Яо, Шумин Денг, Чуанки Тан, Фей Хуан, Хуаджун Чен
ACL 2023, [Paper] [GitHub]
18 сентября 2023 года
Масштабирование отношений в изучении математических рассуждений с большими языковыми моделями
Zheng Yuan, Hongyi Yuan, Chengpeng Li, Guanting Dong, Keming Lu, Chuanqi Tan, Chang Zhou, Jingren Zhou
Arxiv 2023, [Paper] [GitHub]
3 августа 2023 г.
Большие языковые модели могут быть легко отвлечены в нерелевантном контексте
Фрида Ши, Синьун Чен, Канишка Мисра, Натан Скайлз, Дэвид Дохан, Эд Чи, Натанаэль Шарли, Денни Чжоу
ICML 2023, [Paper] [GitHub]
6 июня 2023 года
На пути к рассуждениям в крупных языковых моделях: опрос
Цзе Хуан, Кевин Чен-Чуан Чанг
Результаты ACL 2023, [Paper] [GitHub]
26 мая 2023 года
Саморефина: итеративная уточнение с помощью самоотверженности
Аман Мадан, Никет Тандон, Прахар Гупта, Скайлер Халлинан, Лую Гао, Сара Вигрефф, Ури Алон, Нуха Дзири, Шраймай Прабхумоя, Йимн Ян, Шашанк Гупта, Бодхисаттва Прасад Маджумдер, Катерена Херинанн, Сана -Велк -Уэлк -Озхак, Амс -Падш -Падшай, Амс -Фюрхан, Амс -Падшай, Падша, Пеншак, Амс -Падшай, Сашанк Велк.
Arxiv 2023, [Paper] [GitHub] [Web -Page]
25 мая 2023 года
Саморефина: итеративная уточнение с помощью самоотверженности
Аман Мадан, Никет Тандон, Прахар Гупта, Скайлер Халлинан, Лую Гао, Сара Вигрефф, Ури Алон, Нуха Дзири, Шраймай Прабхумоя, Йимн Ян, Шашанк Гупта, Бодхисаттва Прасад Маджумдер, Катерена Херинанн, Сана -Велк -Уэлк -Озхак, Амс -Падш -Падшай, Амс -Фюрхан, Амс -Падшай, Падша, Пеншак, Амс -Падшай, Сашанк Велк.
Arxiv 2023, [Paper] [Веб -сайт] [github] [Демо]
25 мая 2023 года
Давайте проберите шаг за шагом: адаптивное согласование для эффективных рассуждений с LLMS
Пранджал Аггарвал, Аман Мадаан, Йиминг Ян, Маусам
Arxiv 2023, [Paper] [Веб -сайт] [GitHub]
19 мая 2023 года
Самосогласованность улучшает цепочку мышления в языковых моделях
Xuezhi Wang, Jason Wei, Dale Schuurmans, Quoc Le, Ed Chi, Sharan Narang, Aakanksha Chowdery, Denny Zhou
ICLR 2023, [Paper]
7 марта 2023 года
Повышение в цепочке мышления вызывает рассуждения в крупных языковых моделях
Джейсон Вэй, Сюэжи Ван, Дейл Шуурманс, Мартен Босма, Брайан Ихтер, Фей Ся, Эд Чи, Кук Ле, Денни Чжоу
Neurips 2022, [Paper]
28 января 2022 года
Семантическая последовательность для обеспечения надежности крупных языковых моделей
Харш Радж, Випул Гупта, Доменик Розати, Субхабрата Маджумдар
Arxiv 2023, [Paper]
17 августа 2023 г.
Измерение надежности крупных языковых моделей посредством семантической последовательности
Харш Радж, Доменик Розати, Суббабрата Маджумдар
ML Safety Workshop, Neurips 2022, [Paper]
28 ноября 2022 года
Оперативная последовательность для обобщения задач с нулевым выстрелом
Chunting Zhou, Junxian He, Xuezhe MA, Taylor Berg-Kirkpatrick, Graham Neubig
Результаты ACL: EMNLP 2022, [Paper] [GitHub]
27 декабря 2022 года
Точный, но непоследователь? Анализ согласованности по моделям понимания языка
Myeongjun Jang, Deuk Sin Kwon, Thomas Lukasiewicz
Arxiv 2021, [Paper]
15 августа 2021 г.
Эволюция семантического сходства - опрос
Dhivya Chandrasekaran, Vijay Mago
ACM Computing Survey 2021, [Paper]
30 января 2021 года
Повышение самосогласованности и производительности предварительно обученных языковых моделей с помощью вывода естественного языка
Эрик Митчелл, Джозеф Нох, Сиян Ли, Уилл Армстронг, Анант Агарвал, Патрик Лю, Челси Финн, Кристофер Мэннинг
EMNLP 2022, [Paper] [Веб -сайт] [GitHub]
21 ноября 2022 года
RCOT: обнаружение и исправление фактического несоответствия в рассуждениях путем отмены цепочки мыслей
Tianci Xue, Ziqi Wang, Zhenhailong Wang, Chi Han, Pengfei Yu, Heng Ji
Arxiv 2023, [Paper]
2 октября 2023 года
P-адаптеры: надежно извлечение фактической информации из языковых моделей с разнообразными подсказками
Бенджамин Ньюман, Прафуфла Кумар Чуби, Назнин Раджани
ICLR 2022, [Paper] [GitHub]
19 апреля 2022 года
Как мы можем узнать, какие языковые модели знают?
Чжэнбао Цзян, Фрэнк Ф. Сюй, Джун Араки, Грэм Нойбиг
Tacl 2020, [Paper] [GitHub]
3 мая 2020 года
BiomedGPT: объединенный и универсальный биомедицинский генеративный предварительно обученный трансформатор для зрения, языка и мультимодальных задач
Кай Чжан, Джун Ю., Ихан Адхикарла, Ронг Чжоу, Чилинг Ян, Иксин Лю, Чжэнлиань Лю, Лизанг Х. Х., Брайан Дэвисон, Сян Ли, Хуи Рен, Суньянг Фу, Джеймс Зу, Вэй Лю, Цзин Хуанг, Чен Чен, Юйн Зу, Тянминг Ли Чен Чен Чен Чен Чен, Ион Чен Чен Чен Чен Чен, Тянминг Ли, Quanzheng Li, Hongfang Liu, Lichao Sun
Arxiv 2024, [Paper] [GitHub]
9 января 2024 года
Могут ли крупные языковые модели разумно о медицинских вопросах?
Валентин Лиин, Кристоффер Эгеберг Хотер, Андреас Герт Моцфельд, Оле Винтер
Arxiv 2023, [Paper] [GitHub]
24 декабря 2023 года
На пути к биомедицинскому ИИ
Тао Ту, Шекуфе Азизи, Дэнни Дрисс, Майк Шекерманн, Мохамед Амин, Пи-Чуан Чанг, Эндрю Кэрролл, Чак Лау, Рютаро Танно, Ира Ктена, Базилик Мустафа, Ааканкша Чоудхери, Юн Лю, Саймон Корнблит, Давид Флат, Удушник, Ум. Вирмани, Кристофер Семтурс, Сара Махдави, Брэдли Грин, Эва Доминовская, Блейз Агуэра и Аркас, Джоэл Баррал, Дейл Вебстер, Грег С. Коррадо, Йосси Матиас, Каран Сингхал, Пит Флоренс, Алан Картикесалинг, Вивек Натараджан
Arxiv 2023, [Paper] [GitHub]
26 июля 2023 года
Llava-Med: обучение большого ассистента по биомедицине в течение одного языка и визита за один день
Chunyuan Li, Cliff Wong, Sheng Zhang, Naoto Usuyama, Haotian Liu, Jianwei Yang, Tristan Naumann, Hoifung Poon, Jianfeng Gao
Arxiv 2023, [Paper] [GitHub]
1 июня 2023 года
На пути к медицинским вопросам на уровне экспертов, отвечая на большие языковые модели
Каран Сингхал, Тао Ту, Юрадж Готтвейс, Рори Сэйрес, Эллери Вулчин, Ле Хоу, Кевин Кларк, Стивен Пфол, Хизер Коул-Левис, Дарлин Нил, Майк Шекерманн, Эми Ван, Мохамед Амин, Сами Лакгар, Филип Мансфилд, Сушант Пракаш, Брэдли, Брэдли, Брэдли, Брэдли, Брэдли, Брэдли, Брэдли, Брэдли, Брэдли, Брэдли, Брэдли, Брэдли Грин. Blaise Aguera Y Arcas, Nenad Tomasev, Yun Liu, Renee Wong, Christopher Semturs, S. Sara Mahdavi, Joelle Barral, Dale Webster, Greg S. Corrado, Yossi Matias, Shekoofeh Azizi, Алан Картикисалингам, Вивек Натараджан
Arxiv 2023, [Paper]
16 мая 2023 года
Большие языковые модели кодируют клинические знания
Каран Сингхал, Шекуфе Азизи, Тао Ту, С. Сара Махдави, Джейсон Вей, Хен Уин Чунг, Натан Скайлс, Аджай Танвани, Хизер Коул-Ливис, Стивен Пфол, Перри Пейн, Мартин Сеневиратен, Пол Гамбл, Крис Келли, Натханил Шарш, Аак, Аак, Аак, Аак, Аак, Аакун. Мэнсфилд, Блейз Агуэра и Аркас, Дейл Вебстер, Грег С. Коррадо, Йосси Матиас, Кэтрин Чоу, Юрадж Готтвейс, Ненад Томасев, Юн Лю, Элвин Раджкомар, Джоэл Баррал, Кристофер Семтурс, Алан Картикесалинге
Природа, [бумага]
26 декабря 2022 года
Модели с мультимодальным фондом: от специалистов до помощников общего назначения
Chunyuan Li, Zhe Gan, Zhengyuan Yang, Jianwei Yang, Linjie Li, Lijuan Wang, Jianfeng Gao
Arxiv 2023, [Paper] [Веб -страница]
18 сентября 2023 года