OpenAI выпустила CriticGPT — модель искусственного интеллекта для выявления и исправления ошибок в коде, созданном ChatGPT. CriticGPT основан на мощной модели GPT-4, ориентирован на проверку кода и совершенствуется за счет обучения с подкреплением и обратной связи с людьми с целью повышения качества кода и эффективности проверки. Он отлично справляется с уменьшением бесполезных «придирок» и ложных срабатываний, а в некоторых случаях успешно выявляет ранее незамеченные ошибки. В этой статье будут подробно представлены основные функции, процесс разработки, результаты экспериментов, потенциальные применения и ограничения CriticGPT.
Исследователи OpenAI в четверг объявили о запуске CriticGPT, инновационной модели искусственного интеллекта, предназначенной для выявления и исправления ошибок в коде, созданном ChatGPT. Этот прорыв знаменует собой важный шаг вперед в самосовершенствовании и контроле качества технологий искусственного интеллекта.

Ключевые особенности CriticGPT
1. На основе серии GPT-4: CriticGPT построен на мощной языковой модели GPT-4.
2. Сосредоточьтесь на проверке кода: в основном используется для анализа программного кода, созданного ChatGPT, и выявления потенциальных ошибок.
3. Сотрудничество человека и машины: действует как помощник искусственного интеллекта для инструкторов, повышая эффективность и точность проверки кода.
4. Обучение с подкреплением: улучшите «наладку» системы ИИ, обучаясь на основе обратной связи с людьми (RLHF).

Процесс разработки и результаты
Для разработки CriticGPT исследователи использовали инновационные методы обучения:
1. Подготовка набора данных. Для обучения используйте примеры кода с намеренно вставленными ошибками.
2. Участие человека. Тренеры-люди должны модифицировать код, написанный ChatGPT, вносить ошибки и предоставлять обратную связь.
3. Применение новой технологии: внедрение технологии «Принудительный выборочный лучевой поиск» (FSBS), позволяющей сбалансировать генерацию подробных комментариев и вымышленных вопросов.

Результаты эксперимента показывают:
- В 63% случаев естественных ошибок люди предпочитали CriticGPT.
— CriticGPT уменьшает бесполезные «придирки» и проблемы ложных срабатываний/галлюцинаций.
— CriticGPT успешно обнаружил и подтвердил ошибки в 24% случаев, которые ранее считались идеальными.
Возможные применения и ограничения
Хотя CriticGPT в первую очередь предназначен для проверки кода, исследования показывают, что его можно распространить и на задачи, не связанные с кодированием. Однако эта модель также имеет некоторые ограничения:
1. В основном обучены коротким ответам ChatGPT и могут не подходить для более сложных задач.
2. Хотя фиктивное поведение и сократилось, оно не устранено полностью.
3. Еще есть возможности для улучшения выявления ошибок, распределенных по нескольким частям.
прогноз на будущее
OpenAI планирует интегрировать модели, подобные CriticGPT, в свой конвейер тегов RLHF, чтобы предоставить инструкторам помощь в области искусственного интеллекта. Это представляет собой важный прогресс в разработке инструментов для оценки выходных данных модели большого языка (LLM). Однако исследователи также подчеркнули, что даже с помощью ИИ чрезвычайно сложные задачи остаются сложными для оценщиков-людей.
Поскольку технология искусственного интеллекта продолжает развиваться, такие инновации, как CriticGPT, будут играть ключевую роль в повышении точности и надежности систем искусственного интеллекта, способствуя дальнейшему согласованию искусственного интеллекта с потребностями человека.
Адрес: https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/
Появление CriticGPT знаменует собой значительный прогресс в области самокоррекции и контроля качества моделей ИИ, обеспечивая новое направление для будущего развития технологий ИИ. Хотя CriticGPT все еще имеет некоторые ограничения, его потенциальная прикладная ценность огромна и заслуживает постоянного внимания и исследований.