Загрузка Aira - загрузка исходного кода Aira

Aira

AI Исходный код

v.01

Скачать

Айра

Обнимающееся лицо | Демо | Диссертация

Aira - это серия chatbots , разработанных как экспериментальная игровая площадка для выравнивания стоимости. Эта серия состоит из нескольких моделей, достигнутых с помощью инструкций, точной настройки и методов моделирования предпочтений, таких как обучение подкреплению с повышением человека и непосредственной оптимизацией предпочтений.

Информацию в используемых наборах данных можно найти в папке «Наборы данных». Все модельные карты можно приготовить в папке «Модели».

Предполагаемое использование и демонстрация

Aira предназначена только для академических исследований. Для получения дополнительной информации прочитайте модельные карты наших моделей.

В нашей демонстрации мы предоставляем пользователю панель управления для взаимодействия с нашими моделями, настроенными на инструкции. В этой демонстрации используется reward model и toxicity model для оценки оценки ответа каждого кандидата, учитывая ее согласование с сообщением пользователя и уровнем ее токсичности. Функция генерации организует ответы кандидатов в порядке их оценки вознаграждения и устраняет любые ответы, которые считаются токсичными или вредными. Впоследствии функция генерации возвращает ответ кандидата с наивысшим баллом, который превосходит порог безопасности, или сообщение по умолчанию, если не идентифицированы безопасные кандидаты.

Ограничения

Галлюцинации: эта модель может создавать контент, который может быть принят за истину, но на самом деле является вводящей в заблуждение или совершенно ложным, то есть галлюцинации.
Предвзятость и токсичность: эта модель наследует социальные и исторические стереотипы от данных, используемых для ее обучения. Учитывая эти предубеждения, модель может производить токсическое содержание, т.е., вредное, оскорбительное или вредное для отдельных лиц, групп или сообществ.
Повторение и условно: модель может застрять в петях повторения (особенно, если штраф за повторение в течение поколений устанавливается на скудное значение) или создает условные ответы, не связанные с подсказкой.

Цитировать как?

Все разработанные модели и наборы данных являются частью докторской диссертации Николаса Клуге, « Динамическая норманность: необходимые и достаточные условия для выравнивания стоимости ». Это исследование было финансировано CNPQ (Fundação de Amparo à Pesquisa do Estado do Rio Grande do Sul), Fapergs (Fundação de amparo à pesquisa do estado do rio grande do sul), и Daad (Deutscher akademischer austchdienst), как частично исследовательский проект, департамент Philosephomeshysemessemessemessemessemessemessemessemessemessemessemessemessemessyshysemephomes to Philosephyshyshyshyshyshyshyshyshyshyshyshyshom (Pontifícia Universidade Católica do Rio Grande Do Sul) и Университет Бонна.

@misc{nicholas22aira,
  doi = {10.5281/zenodo.6989727},
  url = {https://github.com/Nkluge-correa/Aira},
  author = {Nicholas Kluge Corrêa},
  title = {Aira},
  year = {2023},
  publisher = {GitHub},
  journal = {GitHub repository},
}

@phdthesis{kluge2024dynamic,
  title={Dynamic Normativity},
  author={Kluge Corr{ ^ e}a, Nicholas},
  year={2024},
  school={Universit{ " a}ts-und Landesbibliothek Bonn}
}