Обнимающееся лицо | Демо | Диссертация

Aira - это серия chatbots , разработанных как экспериментальная игровая площадка для выравнивания стоимости. Эта серия состоит из нескольких моделей, достигнутых с помощью инструкций, точной настройки и методов моделирования предпочтений, таких как обучение подкреплению с повышением человека и непосредственной оптимизацией предпочтений.
Информацию в используемых наборах данных можно найти в папке «Наборы данных». Все модельные карты можно приготовить в папке «Модели».
Aira предназначена только для академических исследований. Для получения дополнительной информации прочитайте модельные карты наших моделей.
В нашей демонстрации мы предоставляем пользователю панель управления для взаимодействия с нашими моделями, настроенными на инструкции. В этой демонстрации используется reward model и toxicity model для оценки оценки ответа каждого кандидата, учитывая ее согласование с сообщением пользователя и уровнем ее токсичности. Функция генерации организует ответы кандидатов в порядке их оценки вознаграждения и устраняет любые ответы, которые считаются токсичными или вредными. Впоследствии функция генерации возвращает ответ кандидата с наивысшим баллом, который превосходит порог безопасности, или сообщение по умолчанию, если не идентифицированы безопасные кандидаты.
Галлюцинации: эта модель может создавать контент, который может быть принят за истину, но на самом деле является вводящей в заблуждение или совершенно ложным, то есть галлюцинации.
Предвзятость и токсичность: эта модель наследует социальные и исторические стереотипы от данных, используемых для ее обучения. Учитывая эти предубеждения, модель может производить токсическое содержание, т.е., вредное, оскорбительное или вредное для отдельных лиц, групп или сообществ.
Повторение и условно: модель может застрять в петях повторения (особенно, если штраф за повторение в течение поколений устанавливается на скудное значение) или создает условные ответы, не связанные с подсказкой.
Все разработанные модели и наборы данных являются частью докторской диссертации Николаса Клуге, « Динамическая норманность: необходимые и достаточные условия для выравнивания стоимости ». Это исследование было финансировано CNPQ (Fundação de Amparo à Pesquisa do Estado do Rio Grande do Sul), Fapergs (Fundação de amparo à pesquisa do estado do rio grande do sul), и Daad (Deutscher akademischer austchdienst), как частично исследовательский проект, департамент Philosephomeshysemessemessemessemessemessemessemessemessemessemessemessemessemessyshysemephomes to Philosephyshyshyshyshyshyshyshyshyshyshyshyshom (Pontifícia Universidade Católica do Rio Grande Do Sul) и Университет Бонна.
@misc{nicholas22aira,
doi = {10.5281/zenodo.6989727},
url = {https://github.com/Nkluge-correa/Aira},
author = {Nicholas Kluge Corrêa},
title = {Aira},
year = {2023},
publisher = {GitHub},
journal = {GitHub repository},
}
@phdthesis{kluge2024dynamic,
title={Dynamic Normativity},
author={Kluge Corr{ ^ e}a, Nicholas},
year={2024},
school={Universit{ " a}ts-und Landesbibliothek Bonn}
}Этот репозиторий лицензирован по лицензии Apache, версия 2.0. Смотрите файл лицензии для получения более подробной информации.